- 博客(538)
- 资源 (6)
- 收藏
- 关注
原创 transformer 相对位置编码详解
如果只用词向量,模型分不清「I like apples」和「apples like I」,因为它们的向量集合是一样的。:注意力计算时,不关心 token 的绝对位置,而是关心 query 和 key 的。这样在打分时,模型同时考虑了内容 (content) 和位置 (position)。这样模型能区分「I」在第1个位置 vs 第3个位置,但还是死记绝对坐标。不直接依赖 token 的绝对坐标,而是利用 query-key 的。,分别展示「无位置编码 / 绝对位置编码 / 相对位置编码」的区别?
2025-09-12 18:55:06
727
原创 ceph 恢复卡在 deleting 状态的 rook-ceph crds
由于 Kubernetes 不允许恢复已删除的资源,因此以下命令可以修复 CR,甚至不必担心集群停机。例如,如果有多个 CephFilesystem 卡在删除状态,则可以恢复特定的文件系统: restore-deleted cephfilesystems filesystem-2。当 Rook CR 被删除时,Rook 运算符将响应删除事件,尝试清理集群资源。如果集群中仍有数据,Rook 将拒绝删除该 CR,以确保数据不丢失。如果集群中有多个已删除的资源,且未提及具体资源,则将恢复第一个资源。
2025-09-11 11:42:34
23
原创 ceph 备份数据
如果挂载的时候不指定连接 mon 信息和密钥等,需要单独写配置文件如下。挂载方式 ceph-fuse 和 mount 任选其一。
2025-09-09 10:47:30
49
原创 引力场能量为负,物质能量为正,这是在存在物质的空间中说的,如果是空无一物的空间呢,引力场能量还是负吗(或者说引力场还存在吗)
牛顿框架:没物质 → 没引力场 → 引力能量为零。广义相对论:空时空 → 只有几何(平直或(反)德西特),没有“负引力能量”。宇宙学语境:所谓“引力能量为负”,是相对于物质存在时的势能定义,并不是空无一物时仍然存在的背景属性。要不要我给你举个更直观的比喻:像一张橡皮膜(时空),放上质量才会被拉下去(才有负势能),如果膜上什么也没有,就是平的 → 不存在“负能量”背景。要不要我把“宇宙总能量可能为零”这个说法的物理逻辑也展开给你?“纯时空零能量”是一个整体守恒的描述,并不等于“绝对无”。
2025-08-29 15:19:12
1004
原创 Ubuntu linux ssd 硬盘分区对齐配置
好的 👍 我给你整理一个完整流程(假设你要用整个盘 ,并挂载到 ):⚠️ 注意:以下操作会清空磁盘上所有数据,请确认 没有需要保留的数据!这样会创建一个 GPT 分区表,并新建一个对齐到 1MiB 的分区 。你可以用 查看结果。3. 创建挂载点4. 获取分区的 UUID输出类似:5. 配置 自动挂载编辑 :在最后加一行:6. 挂载生效确认挂载:这样 就会对齐分区、格式化成 XFS,并挂载到 ,重启后也会自动挂载。要不要我帮你写成一段 Ansible playb
2025-08-28 11:14:56
680
原创 k8s pod 启动失败 Failed to create pod sandbox
再次查看没有都有的沙箱容器了,并且沙箱容器已经启动,这时候相应的 pod 启动就不会失败。由 describe 输出信息可知,是有残留的沙箱容器存在导致的。根据 pod 名字顾虑残留的沙箱容器,注意使用。k8s + docker 运行时。k8s pod 无法启动,
2025-08-26 19:20:48
129
原创 大模型 transformer 步骤
好,明白了。我们用逐词、逐元素、一步步展开的数值示例来讲解 Transformer 自注意力(Q/K/V)是怎么从输入到输出的。你要求不要省略元素,所以我会用小维度,保证完整展示计算。一句话:我们把每个词表示为 3 维向量(为了示例简单,真实模型是 512/1024 维):x1=我=[1,0,1]x_1 = \text{我} = [1,0,1]x1=我=[1,0,1]x2=去=[0,1,0]x_2 = \text{去} = [0,1,0]x2=去=[0,1,0]x3=银行=[1,1,0]x_
2025-08-25 16:33:02
662
原创 大模型知识点之矩阵乘以向量
2、当矩阵的行数不等于向量的维度的时候(列数必须等于向量的维度),相当于做了升维(矩阵行数大于向量维度)或者降维(矩阵行数小于向量维度),另外也做了拉伸(非单位矩阵)等操作。1、矩阵乘以向量的的前提是列数必须等于向量的维度。3、当矩阵的行数等于向量的维度的时候(列数必须等于向量的维度),相当于只做了拉伸(非单位矩阵)等操作。蓝色网格:矩阵作用后的坐标系(整个平面被拉伸+错切)👉 所以:矩阵乘以向量 = 向量在空间中被线性变换。绿色箭头:矩阵变换后的向量。矩阵乘以向量的几何意义。灰色网格:原始坐标系。
2025-08-25 12:03:08
298
原创 为什么矩阵乘以向量要求矩阵列数等于向量维度
矩阵乘向量yWxy = W xyWxyi∑j1nwijxjyij1∑nwijxjW∈Rm×nW∈Rm×nx∈Rnx∈Rny∈Rmy∈Rm要求列数nnn= 向量维度nnn,否则求和无法对应每个输入分量。换句话说,每一列代表输入向量的一个维度,如果列数不匹配,就无法把输入的每个分量“拉到输出空间”的每个分量上。
2025-08-25 12:02:22
638
原创 那我现在有3个输入 9层神经元 每层神经元数为 3 9 3 5 6 2 3 9 8 请给出我所有的权重矩阵
输入向量→矩阵乘法线性变换→加偏置仿射变换→激活函数非线性映射\text{输入向量} \xrightarrow{\text{矩阵乘法}} \text{线性变换} \xrightarrow{\text{加偏置}} \text{仿射变换} \xrightarrow{\text{激活函数}} \text{非线性映射}输入向量矩阵乘法线性变换加偏置仿射变换激活函数非线性映射没有激活函数时:每层就是纯线性仿射变换加上激活函数:把线性变换堆叠成非线性映射。
2025-08-25 11:53:42
497
原创 20250821 黎曼几何距离公式以及这种距离公式的哲学意义以及对于什么是空间的思考
空间不再只是点的集合,而是一种带度量的流形空间的“形状”和“距离”由内部结构(度量张量)决定可以说,空间是一种关系网络,点与点之间的关系(距离、角度)构成了空间的意义空间不必绝对“空”或“满”,它是一种结构化的关系场物质和几何相互作用,空间本身是可以弯曲的,这呼应了现代物理学(广义相对论)对空间的理解。
2025-08-21 15:42:05
1351
原创 Ubuntu ulimit 设置
问题原因是否符合你的情况systemd的限制了你✅ 很可能使用了非 login shell(例如sudo su✅ 可能本身无效❌ 配置正确PAM 未加载如果你配置了就 ✅systemd 启动服务时没有设置✅ 如果你关心后台服务需要我帮你定制一份修复流程(比如你的发行版是 Ubuntu 20.04,使用 systemd)可以继续贴出来,我可以一步步帮你操作。
2025-08-05 11:13:26
368
原创 grafana/lock-stack 日志 Pipeline 配置
本文使用的是 grafana/loki-stack chart 抓取的 k8s 日志。其他 chart 配置都差不多。
2025-08-01 18:17:48
377
原创 k8s ceph sc 设置文件系统格式化参数
默认的 sc 文件系统 inode 太少,对于小文件场景,往往会出现容量没满,inode 已经用尽的情况,本文说明如何设置 inode。
2025-07-31 14:56:15
115
原创 20250728 广义相对论能确定空间是无限吗?空间为啥就不能是在这处是平坦,在另外一处是弯曲,在另另外处是双曲... ...
空间可以局部多样;空间可以无限,但时间仍有起点;极端的密集和极端的空虚在结构上趋于等价;真正的宇宙状态应介于两者之间,持续演化。这类观点和一些当代宇宙学中的“循环宇宙”“量子涨落起源”“共形宇宙”有共鸣,也富有哲学意蕴。宇宙是否“诞生于无”?(如劳伦斯·克劳斯、Alex Vilenkin 的观点)Penrose 的共形循环宇宙(CCC)理论信息论视角下的“可区分性”与“存在”的关系想深入哪一块?我可以继续分析。问题克劳斯 / Vilenkin 的回答哲学问题。
2025-07-28 18:56:22
559
原创 查看网站证书有效期
https://bh.wemall.com.cn/admin/login/index 给我看看证书有效期是到什么时候抱歉,我无法直接访问的网站来提取 SSL 证书信息。
2025-07-25 13:38:46
274
原创 ansible 批量 scp 和 load 镜像
在本地保存镜像到 ansible 代码目录的脚本。scp files 目录下的所有镜像并 load。保存某个 namespace 下的所有镜像。scp 单个镜像并 load。scp 多个镜像并 load。
2025-07-22 11:58:58
152
原创 ceph pg incomplete 状态 ceph config set osd.xxx osd_find_best_info_ignore_history_les true
这时候可以对某个(或所有)OSD 设置这个参数,让 PG 恢复流程继续下去。需要我帮你排查卡在某个 PG 的。
2025-07-18 10:33:47
47
原创 ubuntu 22.04 pam 模块设置用户登录失败锁定
加到如下行后加到最后一行修改一键设置脚本⚠️警告:不要在 ubuntu20.04 系统上执行如下脚本,否则所有登录方式都会被锁定,导致进不了系统。查看被锁定的用户解锁被锁定的用户。
2025-07-17 15:57:28
398
原创 ubuntu 22.02 带外进单用户拯救系统
不停地按 F7 ,然后进到 menu ,选择 ubuntu ,然后按下 ESC ,然后瞬间会刷一个 ubuntu 的选项(默认是在第一的位置,直接快速按下 e)即可进入单用户模式。⚠️ 注意:你在单用户模式下没有完整的 systemd 或 reboot 服务,普通的 reboot 命令可能无效,所以加 -f 强制重启。系统将直接进入一个 root shell,无需密码。按 Ctrl + X 或 F10 启动。挂载根目录为读写(如果没自动是 rw)
2025-07-17 15:49:25
270
原创 20250709 亚历克斯维连金的隧穿理论基于什么?大多数科学家认可吗?反对意见反对的是什么?虚无的定义还是虚无隧穿或者是其他什么,比如边界条件的假设
维度内容基于量子力学隧穿 + Wheeler-DeWitt 方程核心假设宇宙可从“虚无”量子隧穿产生争议点虚无是否真是“无”?边界条件是否合理?可证伪性?认可度在量子宇宙学领域中有影响,但并非公认标准答案哈特尔-霍金模型的细节;更激进的如 Carlo Rovelli(圈量子引力)或 Penrose 的观点;或者进一步对比“哲学意义的虚无” vs “物理意义的虚无”。观点内容❌ 批评从无时间中产生时间涉及逻辑悖论,因“变化”本身就假设了时间✅ 支持时间是涌现的、次生的;
2025-07-10 11:06:07
812
原创 20250708 如果是无限致密的实体充满了无限大的空间,是不是就是空间消失了
角度空间是否消失?原因经典物理否空间是容器,被填满仍存在广义相对论是(可能)无限密度导致时空退化拓扑/几何是无法定义度量与结构哲学/形上学是无差异 → 无关系 → 无空间如果你愿意,我们可以进一步类比这种“无限密度 → 空间消失”的状态和宇宙奇点、道家无极、或者 Loop Quantum Gravity 的前几何结构,这些思想都有异曲同工之妙。是否要继续?“没有结构,还能有空间吗?角度空间是否存在?原因数学(集合论)✅ 可形式化存在抽象点集仍可称为“空间”
2025-07-08 19:38:16
751
原创 20250707 泰格马克的数学存在矛盾吗,比如数学中不同的公理体系是有矛盾的,比如平行线公设,不同的几何就是矛盾的
你的问题泰格马克的回应是否说服人数学结构彼此矛盾,怎么能都是真的?它们是不同的结构,都自洽就可以存在部分学者接受,但哲学家普遍质疑那“真实宇宙”该选哪个?我们处于某一个可孕育意识的结构中属于“选择效应”逻辑,缺乏预测性不同几何冲突怎么办?它们都对应不同宇宙,无需统一结构主义立场,但弱于实证性泰格马克思想的形而上学基础(如柏拉图主义 vs 数学工具主义);“数学是否发明还是发现”;“空间作为公理的结果”vs“空间作为经验现象”;
2025-07-07 10:54:01
780
原创 python 笔记
定义:同一个时间点上,同时存在的对象,如果 id 内存地址一样,一定是同一个对象。已经被销毁了,在原来的内存地址又新建了。因此,他们不是同一个对象。
2025-07-04 18:33:09
201
原创 汇编 函数调用栈
首先明白几个概念在x86系统的CPU中,rsp是栈指针寄存器,这个寄存器中存储着栈顶的地址。rbp中存储着栈底的地址。函数栈空间主要是由这两个寄存器来确定的。其次 x86 栈高处是高地址,低处是低地址,rsp 向下增长(sub rsp n)。
2025-07-04 15:32:27
397
原创 vllm 里的 Automatic Prefix Caching 是什么意思,详细讲解下这个概念
vLLM 的 Automatic Prefix Caching 本质上是智能复用共享前缀的 KV Cache,以避免重复计算,提升推理效率、吞吐量和显存利用率。它与 Huggingface、Triton 的区别;实现细节中的 PagedAttention;是否支持 Streaming;我可以继续深入解释。需要吗?Q: 多并发场景中 prompt 都不同,Automatic Prefix Caching 还有意义吗?A: 有!因为在实际应用中,并发请求往往存在前缀重复或相似结构。
2025-07-04 11:26:54
1300
原创 20250703 我觉得空间本来就是空空如也,不是什么欧式非欧那种
问题可能的回答物体如何在空空间展开?物体和它们的关系赋予空间结构,空间几何是物体的表现没有度量无结构还能认出空间?数学拓扑可能承认无度量空间,但感知和物理定义可能失效空间能脱离物质独立存在?经典绝对空间观点支持,现代物理和哲学认为空间依赖物质与场爱因斯坦的时空观莱布尼茨与牛顿空间论争现代量子引力入门佛学空性与缘起的对比分析或者帮你用数学拓扑/因果集模型模拟“无结构空间”展开物体的过程。你看呢?
2025-07-03 19:16:53
934
原创 20250703 黎曼曾经说过,人类不能了解空间的全局性质,只能了解空间的局部性质,什么意思
黎曼说“人只能了解空间的局部性质”,意思是:经验限制:我们的经验和测量总是局部的;几何本质:几何可以在局部定义,空间可以是局部弯曲、但全局形状不一;知识边界:我们不能凭借局部信息推断整个空间的形状或性质。这句话体现了他对几何学的哲学深度,也预示了现代物理对空间认识的复杂性。三角形是有限区域,无法代表全局;空间可能在这一小片区域是正曲率,在别处却是负曲率、零曲率或更复杂的结构;空间可能是弯曲、但仍然无限大,或者是封闭的但局部看不出来;因此,我们只能得出“这个小区域有曲率”,但。
2025-07-03 16:43:56
885
原创 20250702 黎曼几何距离公式,解释下每个参数含义
这是黎曼几何距离公式吗,解释下每个参数含义是的,你这张图中的公式确实出现在黎曼几何背景下,尤其是中。该公式是。
2025-07-02 18:14:43
1035
原创 vllm 张量并行 tensor-parallel-size 和流水线并行 pipeline-parallel-size
这是两个中常见的并行技术,功能不同,
2025-06-30 14:54:59
1354
1
原创 macos 安装 xcode
安装方式适合场景说明绝大多数命令行编译任务快速安装,轻量,占用小App Store 完整 Xcode图形化开发、调试包含 IDE,体积大,功能全。
2025-06-30 12:01:33
879
原创 python 使用 pyenv 管理 python 版本
说明:切换的前提是使用 pyenv 安装了该版本(非 pyenv 安装的 python 无效)。安装 pyenv 并使用 pyenv 安装不同版本的 python。切换 python 版本。
2025-06-29 21:49:46
268
原创 20250628 求解广相场方程可以得到始于奇点终于奇点的结论,从大量的天文学观测现象和研究进展中,黑洞现象应该说得到了证实,那么,本宇宙始于奇点也是顺理成章的结论。 问题是,考察现有宇宙中的黑洞现象
黑洞奇点存在于已有时空中,我们自然可以在其“外部”存在。宇宙学奇点是整个时空的起点,不存在“其外部”的时空,因为**“空间”本身就是从那一刻起开始的。**从物理上讲,这不是逻辑矛盾,而是广义相对论时空结构的结果。然而,从哲学上、形而上学上来看,这也许并不是终点,而是我们理解的极限,正如你所感受到的,“我们之所以还能提问‘奇点之外’,说明思维尚未终止”。
2025-06-28 13:51:27
1075
Tunneling wave function of the universe
2025-06-24
宇宙学德西特极小超空间中隧穿波函数的量子场反作用问题研究:精确计算与路径积分方法比较了在德西
2025-05-20
【量子宇宙学】不同宇宙波函数提案分析:隧穿边界条件与路径积分方法在量子宇宙学中的等价性探讨
2025-05-20
宇宙学评析Krauss“无中生有”理论:广义相对论与量子场论视角下的宇宙起源争议分析要求,具体解析
2025-05-20
宇宙学基于量子隧穿的宇宙创生模型:从无到有的宇宙生成机制与膨胀理论探讨
2025-04-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人