
人工智能AI
文章平均质量分 77
土豆.exe
部分内容已涉密隐藏
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
减少大型Transformer模型激活再计算的训练加速方法
作者机构: NVIDIA摘要训练大型Transformer模型是现代人工智能中最重要且最具挑战性的计算任务之一。本文展示了通过减少激活重计算来显著加速大型Transformer模型训练的方法。传统的做法是通过存储部分激活来避免内存限制,但这种方法增加了冗余计算。本文提出两种新颖且简单的技术:序列并行性和选择性激活重计算。结合张量并行性,这些技术几乎消除了重新计算激活的需求。实验表明,在多达1万亿参数的语言模型上,这种方法将激活内存减少了5倍,同时减少了90%以上的执行时间开销。原创 2025-03-07 21:09:16 · 807 阅读 · 0 评论 -
参数少,实力强,QwQ-32B 成大模型新宠!
的卓越性能,凭借强化学习、高效参数利用、智能体集成等创新技术,成为大模型领域的一匹黑马。Hugging Face 提供了便捷的 API,可以快速使用 QwQ-32B 进行推理。随着 AI 技术不断进步,QwQ-32B 的成功也启发我们——参数规模并非唯一衡量标准,QwQ-32B 的成功,离不开强化学习(RL)技术的突破。,类似一支训练有素的精锐部队,虽然规模小,但战斗力极强。的强化学习扩展方法,从冷启动检查点开始,逐步提升模型能力。然而,QwQ-32B 颠覆了这一认知,以。,也为大模型研究提供了新的方向。原创 2025-03-07 16:37:25 · 1063 阅读 · 0 评论 -
olmOCR:高效精准的 PDF 文本提取工具
olmOCR 以精准的文本提取、强大的复杂内容识别、高效的 GPU 处理能力,为 PDF 解析提供了一站式解决方案。无论是学术研究、合同管理,还是大规模文档处理,它都是一个理想选择。立即体验 olmOCR,开启高效 PDF 文本提取新时代!原创 2025-03-07 16:50:40 · 1207 阅读 · 0 评论 -
一键解密,网络安全神器现已问世!
这款工具是一款功能强大的网络安全综合工具,旨在为安全从业者、红蓝对抗人员和网络安全爱好者提供全面的网络安全解决方案。它集成了多种实用功能,包括解密、分析、扫描、溯源等,为用户提供了便捷的操作界面和丰富的功能选择。原创 2024-05-07 19:35:23 · 4491 阅读 · 7 评论 -
AI学习KnnDemo
import numpy as np #引用科学计算法,例如[listData.apppend(i) for i in Menu]可以写为listData.apppend(np.array(Menu)) np.array(arg[])使arg[]变为可被调用的方法迭代的特殊数组类型from collections import Counterclass MyKnnClassifer(object): #自定义基于KNN算法的分类器 def __init__(self, k=.原创 2021-06-12 21:00:20 · 209 阅读 · 6 评论