
心流
文章平均质量分 87
学习,工作,思考。心流(Mental Flow),知行合一。
叶庭云
做的所有努力都是为了降低不确定性,提升概率。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
使用 np.zeros_like(label) 保存预测概率时发现数据类型不匹配导致的隐式类型转换
使用 np.zeros_like(label) 保存预测概率时发现数据类型不匹配导致的隐式类型转换原创 2025-04-29 20:41:10 · 584 阅读 · 0 评论 -
对张量 output_tensor - torch.Size([36, 1, 1000, 2048]) 进行 torch.mean(output_tensor, dim=-2).squeeze()
含义:对每个隐藏层、每个 “分段”,把 1000 个 Token 的 2048 维向量做平均,得到一个长度 2048 的 “全序列平均” 向量。该序列将所有 Token 的上下文信息融合为一个固定长度的向量,常用于文本分类、相似度计算等需要句子级表示的场景。:dim=-2 指的是从后往前数的第 2 个维度,也就是原张量的 “1000” 这一维(序列长度维度)。就是对原始序列在 Token 维度上进行 Token 平均后,去掉多余维度得到的最终特征表示。具体阐述此操作对输入张量进行了怎样的变换。原创 2025-04-28 13:24:12 · 509 阅读 · 0 评论 -
一文了解 Sublime Text 4 最新安装教程
一文了解 Sublime Text 4 最新安装教程原创 2025-03-25 15:33:40 · 621 阅读 · 0 评论 -
PyTorch 深度学习框架中 torch.cuda.empty_cache() 的妙用与注意事项
PyTorch 深度学习框架中 torch.cuda.empty_cache() 的妙用与注意事项原创 2025-02-20 20:57:04 · 2038 阅读 · 0 评论 -
解决问题: wps 无法加载此加载项程序 (c:\users\administratorappdata\roaming\microsoft\word\startup\mathpage.wll)
解决问题:wps 无法加载此加载项程序 (c:\users\administratorappdata\roaming\microsoft\word\startup\mathpage.wll)原创 2025-02-18 22:58:45 · 1435 阅读 · 0 评论 -
为何实现大语言模型的高效推理以及充分释放 AI 芯片的计算能力对于企业级落地应用来说,被认为具备显著的研究价值与重要意义?
为何实现大语言模型的高效推理以及充分释放 AI 芯片的计算能力对于企业级落地应用来说,被认为具备显著的研究价值与重要意义?原创 2025-02-06 22:44:45 · 1016 阅读 · 0 评论 -
计算机科学与人工智能专业的应届毕业生应如何提高自身的就业的认知和竞争力?
深入分析:在当前中国高校的教育体系及就业市场环境下,计算机科学与人工智能专业的应届毕业生应如何提高自身的就业的认知和竞争力?原创 2025-02-06 21:31:25 · 1139 阅读 · 1 评论 -
一文了解硅基流动(SiliconCloud):有前景的大模型云服务平台
一文了解硅基流动(SiliconCloud):强大的大模型云服务平台原创 2025-02-03 17:04:49 · 88397 阅读 · 15 评论 -
啊哈?白宫正在调查 DeepSeek 人工智能对国安的影响
啊哈?白宫正在调查 DeepSeek 人工智能对国安的影响原创 2025-01-29 18:55:36 · 1177 阅读 · 0 评论 -
令人振奋的新的一年,拥抱 AI 智能体时代!
令人振奋的新的一年,拥抱 AI 智能体时代!原创 2025-01-18 10:53:45 · 810 阅读 · 0 评论 -
你对科学研究内涵的理解是什么?你应该知道的科学研究的内涵!
你对科学研究内涵的理解是什么?你应该知道的科学研究的内涵!原创 2025-01-16 20:34:57 · 552 阅读 · 0 评论 -
一文理解机器学习中二分类任务的评价指标 AUPRC 和 AUROC
一文理解机器学习中二分类任务的评价指标 AUPRC 和 AUROC原创 2024-12-23 22:52:25 · 3962 阅读 · 0 评论 -
Matlab 和 R 语言的数组索引都是从 1 开始,并且是左闭右闭的
Matlab 和 R 语言的数组索引都是从 1 开始,并且是左闭右闭的。原创 2024-12-22 23:59:12 · 1289 阅读 · 0 评论 -
一文了解 Python 多线程编程,线程池,共享字典,竞态条件问题
一文了解 Python 多线程编程,线程池,共享字典,竞态条件问题原创 2024-12-22 23:00:22 · 1753 阅读 · 0 评论 -
深入分析:将大语言模型生成的结果称为 “Responses“(响应),这是否为标准说法呢?
深入分析:将大语言模型生成的结果称为 “Responses“(响应),这是否为标准说法呢?原创 2024-12-11 23:51:04 · 503 阅读 · 0 评论 -
为什么说 ChatGPT 大语言模型是一个 “格式控”?
为什么说 ChatGPT 大语言模型是一个 “格式控”?原创 2024-12-11 22:42:14 · 650 阅读 · 0 评论 -
一文理解 “Bootstrap“ 在统计学背景下的含义
一文理解 “Bootstrap“ 在统计学背景下的含义原创 2024-12-10 22:20:55 · 655 阅读 · 0 评论 -
一文了解 Hugging Face 平台
一文了解 Hugging Face 平台原创 2024-11-29 17:04:03 · 2673 阅读 · 0 评论 -
一文理解 Python 编程语言中的 os.makedirs() 方法
一文理解 Python 编程语言中的 os.makedirs() 方法原创 2024-11-22 15:31:58 · 2686 阅读 · 0 评论 -
一文理解 Python 编程语言中的 .strip() 方法
一文理解 Python 编程语言中的 .strip() 方法原创 2024-11-21 16:15:17 · 1473 阅读 · 0 评论 -
一文了解 OpenAI o1-preview 和目前不支持传入的参数
一文了解 OpenAI o1-preview 和目前不支持传入的参数原创 2024-11-20 19:11:58 · 1740 阅读 · 0 评论 -
一文了解 inductive bias(归纳偏好)
一文了解 inductive bias(归纳偏好)原创 2024-11-18 21:17:47 · 1357 阅读 · 0 评论 -
如何解决将长视频转换为易于处理的 Spacetime Patch 的问题?
如何解决将长视频转换为易于处理的 Spacetime Patch 的问题?原创 2024-11-18 20:55:56 · 952 阅读 · 0 评论 -
一文了解本地 OSS 可视化工具
一文了解本地 OSS 可视化工具原创 2024-10-22 16:43:30 · 1156 阅读 · 0 评论 -
数据异质性与数据异构性的本质和举例说明
数据异质性与数据异构性的本质和举例说明原创 2024-10-02 16:45:18 · 2711 阅读 · 1 评论 -
一文了解最先进、最强大的大语言模型都是哪些?
一文了解最先进、最强大的大语言模型都是哪些?原创 2024-10-01 23:35:35 · 2330 阅读 · 0 评论 -
在 AI 大模型时代,了解 Agentic RAG 的核心理念至关重要
在 AI 大模型时代,了解 Agentic RAG 的核心理念至关重要原创 2024-10-01 00:28:25 · 1313 阅读 · 0 评论 -
卷积神经网络(CNN)的计算量和参数怎么准确估计?
卷积神经网络(CNN)的计算量和参数怎么准确估计?原创 2024-09-30 23:54:43 · 1949 阅读 · 2 评论 -
了解华为计算产品线,昇腾的业务都有哪些?
了解华为计算产品线,昇腾的业务都有哪些?原创 2024-09-30 23:28:45 · 4537 阅读 · 0 评论 -
了解针对基座大语言模型(类似 ChatGPT 的架构,Decoder-only)的重头预训练和微调训练
了解针对基座大语言模型(类似 ChatGPT 的架构,Decoder-only)的重头预训练和微调训练原创 2024-09-26 00:22:10 · 1294 阅读 · 0 评论 -
关于 VSCode 的代码文件功能,实现避免水平滑动来查看过长的字符串
关于 VSCode 的代码文件功能,实现避免水平滑动来查看过长的字符串原创 2024-09-14 14:53:06 · 654 阅读 · 0 评论 -
一点思考:在 Python 数据科学和机器学习研究背景下,代码审查(Code Review, CR)的必要性
一点思考:在 Python 数据科学和机器学习研究背景下,代码审查(Code Review, CR)的必要性原创 2024-09-07 12:31:58 · 1609 阅读 · 0 评论 -
相似图像、相似商品检索的流程具体是什么样的?
相似图像、相似商品检索的流程具体是什么样的?原创 2024-09-01 23:02:02 · 1420 阅读 · 0 评论 -
开放题:如何利用深度学习来重参数化 K-means 聚类,这样的思路要做出效果,它的前向传播、反向传播以及优化目标最好是什么样的?
开放题:如何利用深度学习来重参数化 K-means 聚类,这样的思路要做出效果,它的前向传播、反向传播以及优化目标最好是什么样的?原创 2024-09-01 21:52:27 · 1473 阅读 · 0 评论 -
ANN(Approximate Nearest Neighbor)搜索和索引库到底是什么?
ANN(Approximate Nearest Neighbor)搜索和索引库到底是什么?原创 2024-08-06 21:32:10 · 2014 阅读 · 0 评论 -
大规模深度学习推理引擎是什么?
大规模深度学习推理引擎是什么?原创 2024-08-04 17:18:31 · 1209 阅读 · 0 评论 -
PyTorch 2.X 中 nn.functional.mse_loss() 函数中 reduction 参数的 “mean“ 和 “sum“ 选项的本质区别和影响
PyTorch 2.X 中 nn.functional.mse_loss() 函数中 reduction 参数的 "mean" 和 "sum" 选项的本质区别和影响原创 2024-08-03 14:24:43 · 2202 阅读 · 0 评论 -
Ranger 优化器 UserWarning: This overload of add_, addcmul_, addcdiv_ is deprecated
Ranger 优化器 UserWarning: This overload of add_, addcmul_, addcdiv_ is deprecated原创 2024-08-03 13:56:50 · 433 阅读 · 0 评论 -
在利用 Python 编码和 PyTorch 深度学习框架训练神经网络和实验评估时,如何控制所有可能的随机性?
在利用 Python 编码和 PyTorch 深度学习框架训练神经网络和实验评估时,如何控制所有可能的随机性?原创 2024-08-02 23:45:01 · 1233 阅读 · 1 评论 -
为什么要设置 os.environ[“PYTHONHASHSEED“] = “0“,这样做具体会影响哪些随机值?
为什么要设置 os.environ["PYTHONHASHSEED"] = "0",这样做具体会影响哪些随机值?原创 2024-08-02 23:24:20 · 1361 阅读 · 0 评论