自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(591)
  • 收藏
  • 关注

原创 00后中国女孩0产品创业实现3亿估值:斯坦福数学博士的AI量化野心

来源 | 量子位斯坦福华人数学博士AI创业,0产品0用户,目标估值3亿美元。方向瞄准数学AI,要为量化和对冲基金公司提供可解决实际数学问题的模型能力。(嗯,打造了DeepSeek的幻方量化,也是用AI来做投资量化)

2025-06-05 16:52:44 380

原创 重磅开源!首个全异步强化学习训练系统来了,SOTA推理大模型RL训练提速2.77倍

由于推理模型的输出长短差异极大,在同样的批大小(batch size)下,RL 训练必须等待批次中最长的输出生成完才能继续进行训练,以及进行下一个批次的数据收集,造成极大 GPU 资源浪费。staleness 表示当采用一个批次的数据进行模型训练时,生成最旧的一条数据的模型版本和当前更新的模型版本之间的版本差(比如,一个批次中最旧的一条数据由 step 1 产生的模型输出,当前模型由 step 5 产生,则该批次 staleness=4)。带有奖励值的轨迹数据会被存入回放缓冲区,等待训练器进行训练。

2025-06-05 16:52:10 405

原创 惊人天价!台积电1.4nm晶圆成本曝光

此外,先前也传出Google的高层造访台积电的消息,可能是为了Pixel智能手机的芯片Tensor G5将采用3纳米制程的合作而到访,预计这项合作伙伴关系将持续至少达五年之久,也使得Google成为台积电的长期客户之一。指出,台积电正持续发展其最先进制程技术,但随之而来的是晶圆生产成本的显著飙升,即使是对其获利最丰厚的客户,面对如此高昂的晶圆生产成本,也可能需要再三考虑下单的可能性。根据市场消息指出,紧随2纳米之后的1.4纳米制程(A14),也被称为埃米(Angstrom)制程,其成本预计将进一步攀升。

2025-06-05 16:51:34 133

原创 经典ReLU回归!重大缺陷「死亡ReLU问题」已被解决

与所提出的 B-SiLU 替代函数结合使用时,VGG-16 在 CIFAR-10 和 CIFAR-100 数据集上的测试准确率分别提升了 10 个百分点和 16 个百分点,而 ResNet-18 与未使用 SUGAR 的最佳模型相比,分别提升了 9 个百分点和 7 个百分点。对 VGG-16 层激活的深入分析表明,当应用 SUGAR 时,激活分布发生了明显的变化,为其在缓解消亡 ReLU 问题中的作用提供了直观证据,同时促进了更稀疏的表示。在深度学习领域中,对激活函数的探讨已成为一个独立的研究方向。

2025-06-04 17:21:12 872

原创 Science披露:近3年,垃圾论文激增,92%来自中国

西北大学的Reese Richardson表示,其他研究人员在一些课题中也发现了类似现象,"这种免费数据源让几乎任何人都可以采用已知的研究方法,然后换上新的变量,以一种‘疯狂研究’的姿态创造出新的‘发现’。”他补充道,研究人员为了自身职业发展,往往选择发表更多的论文而不是更高质量的论文。Spick团队的报告指出,近年来基于NHANES数据库的低质论文泛滥,可能是“论文工厂”的运作、人工智能生成文本的滥用以及大型公共数据库的成熟共同促成的。,而在2021年之前的论文中,这一比例仅为8%。

2025-06-04 17:20:11 159

原创 陶哲轩痛诉很缺钱!科研经费暴跌67%十年最低,自掏腰包科研

陶哲轩的警告掷地有声。也体现在另一面——给出了此类效率的理论上限,从而设定了正确的评估基准,避免在数学上不可能的编码方案上浪费资源。当科研经费只够你证明一个想法似乎可行,却不足以让你深入挖掘、系统研究、培养团队时,那么,所谓的创新,可能就真的只能永远停留在「概念」阶段了。「事实证明,」陶哲轩解释道,「在探索这些高维版本的球体堆积问题时产生的许多数学技巧和见解,对于解决这个问题价值巨大。基础数学的探索,正是这样一种对事物本质的极致追问,它剥离掉现实的复杂表象,去触碰最底层的逻辑和结构。

2025-05-28 14:05:24 1117

原创 DeepSeek最新模型意外泄露~

如果信息属实DeepSeek-V3-0526应该很快就会发布,毕竟马上又要端午节了,犹记得五一前国内大模型厂商那一波组团发布,那么问题又来了,万众期待的DeepSeek R2还有多远?DeepSeek-V3-0526模型性能媲美 GPT-4.5 / Claude Opus 或将成为最强开源模型。来源 | PaperAgent。

2025-05-28 12:21:38 610

原创 陕西一高中生与教授父亲共同署名发表3篇SCI论文,父亲同事:学校已调查清楚,没有任何问题,他们都很努力!多方回应

陕西省西安中学国际部的官网消息显示,张某苒是该校2024届学生,曾多次获国际大赛奖项,其中包括2023年英国生物测评(BBO)全球金奖、2022年美国生物奥林匹克竞赛金奖、2022年澳大利亚化学测评(ASOC)全球二等奖等。此外,在另外两篇分别发表于2023年、2024年的英文论文当中,张某苒分别以第三作者和第一作者的身份与张某莺共同署名。近日,有网友报料称,陕西省西安中学国际部2024届学生张某苒多次以作者身份发表SCI论文,而这些论文的作者中还有她的父亲陕西理工大学教授张某莺。

2025-05-28 12:20:34 262

原创 刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿

其实,分享出这个视频的,是前谷歌DeepMind员工Stephen Roller,后来,他又跳到了Character AI,现在来到了Thinking Machines Lab。但我们对ChatGPT的愿景,是让它无论你身在何处,都能陪伴你的整个生活。而且,他还发现了一件事,就是很多人在训练出不错的模型但达到瓶颈后,通常不会尝试分支搜索,即不会把这个模型衍生出几个不同学习率的训练路径。我们希望ChatGPT成为█████████████████████████████████████████████。

2025-05-27 14:10:57 1044

原创 马斯克重磅官宣

此前,马斯克旗下社交平台X在24日早间发生大规模宕机,目前服务已基本恢复。马斯克强调,本周社交媒体平台X出现运行中断,显示亟需进行重大运营改进,平台应该有应对故障的灾备冗余,但未能起效。此外,马斯克于5月20日在卡塔尔经济论坛上还强调,未来他将减少在政治领域的支出,自己已经做得够多了。当地时间5月24日,马斯克在社交媒体X平台宣布,他已经重新回到7×24小时工作的状态,还要“睡在会议室、服务器机房或工厂里”。他表态称:“我必须全神贯注于X/xAI和特斯拉,还有下周的星舰发射,因为我们正推出关键技术。

2025-05-27 14:10:26 278

原创 全球第一AI科学家天团,首战封神!2.5个月找到治盲新药,医学圈震撼

团队介绍说,为了生成针对干性AMD的新型治疗候选药物,他们创建了一个管线,把三个智能体Crow、Falcon(文献综述智能体)和Finch(原型数据分析智能体)连接了起来。AI科学家智能体,这次直接包办了写论文所需的全过程,人类根本无需插手——它生成了假设、设计了实验、分析了数据、进行了迭代,甚至为论文制作了图表。中间的Ali,是一名临床科学家,正在公司建立药物研发管线。这应该是人类首次做到,让AI将假设生成、实验和数据分析以闭环的形式连接起来,这也标志着,智能体推动的科学发生速度,从此会大幅加快!

2025-05-26 20:41:42 534

原创 深度|Anthropic首席产品官:从Claude到MCP,最好的AI产品不是计划出来的,是从底层自发长出来的

Mike是Anthropic的首席产品官,曾参与创办Instagram,也在红杉资本的创始人之一,长期专注于产品从0到1的打造。例如,以前我们常常关注一个文档的出处,比如有没有引用、是不是原创,这些问题现在依然重要,但在AI帮助下也变得更容易追踪。我们也在观察OpenAI的一些做法,比如他们可能会对ChatGPT做专门的微调版本,虽然大家主要是通过Chat界面来用它,但背后可能跑的是不同模型。举个例子,当你让模型帮你做点事,它说“我做不到”,但实际上是你没有设计好接口,让它能够调用这些功能。

2025-05-26 20:40:53 920

原创 爆!莫迪宣布:印度首颗芯片,诞生!

未来几年,这一贸易额将突破2000亿美元,而东北地区将成为实现这一目标的坚实桥梁。他表示,投资者不仅有机会投资东北地区的工厂和基础设施,而且还有投资该地区制造业的黄金机会。总理表示,稳健的道路、良好的电力基础设施和物流网络是所有行业的支柱。这意味着,稳健的基础设施是任何发展的首要条件,是基础。印度总理纳伦德拉·莫迪周五(5月23日)宣布,印度将很快获得东北地区半导体工厂生产的第一块“印度制造”芯片。莫迪表示,政府正在东北各邦的水电或太阳能领域进行大规模投资,价值数千万卢比的项目已经分配。

2025-05-26 20:40:22 347

原创 刚刚!首个下一代大模型Claude4问世,连续编程7小时,智商震惊人类

Claude Opus 4 是 Anthropic 迄今为止最强大的模型,也是全球最强的编码模型,它在 SWE-bench(72.5%)和 Terminal-bench(43.2%)基准上均处于领先地位,在需要专注投入和数千个步骤的长时间运行任务中表现出色,并能够连续工作数小时 —— 其性能远超所有 Sonnet 模型,并显著扩展了 AI 智能体的功能。Anthropic 表示,Claude Opus 4 是一款全球领先的编码模型,它在复杂、长时间运行任务和智能体工作流中拥有持续的高性能。

2025-05-24 18:47:08 517

原创 比Gemini Diffusion更全能!首个多模态扩散大语言模型MMaDA发布,同时实现强推理与高可控性

杨灵:普林斯顿大学 Research Fellow,北京大学博士,研究方向为大语言模型、扩散模型和强化学习。田野:北京大学智能学院博士生,研究方向为扩散模型、统一模型及强化学习。沈科:字节跳动 Seed 大模型团队的 AI 研究员,研究方向为大语言模型预训练和统一学习范式。童云海:北京大学智能学院教授,研究领域涵盖多模态大模型、图像/视频的生成与编辑。

2025-05-24 18:45:44 647

原创 拒绝不必要Think:微软&北大提出第一种自适应大型混合推理模型

大型推理模型(LRMs)过度冗长的思考过程在token消耗和延迟方面带来了巨大的开销,尤其是对于简单查询来说,这种思考过程往往是不必要的。微软研究院&北大提出了大型混合推理模型(LHRMs),这是第一种能够根据用户查询的上下文信息自适应地决定是否进行思考的模型。为了实现这一目标,提出了一种包含两个阶段的训练流程:以混合微调(HFT)作为冷启动,随后通过提出的混合群体策略优化(HGPO)进行在线强化学习,以隐式地学习选择合适的思考模式。

2025-05-23 10:42:23 484

原创 帮大模型提速80%,华为拿出昇腾推理杀手锏FlashComm,三招搞定通算瓶颈

针对 DeepSeek 这类超大规模 MoE 模型的多机多卡推理场景中的通信挑战,华为团队提出了三项关键技术,其中 FlashComm 技术基于相同的集合通信逻辑替大模型推理中的 AllReduce 通信算子,在不改变网络并行方式的前提下,充分利用网络中低维度数据或低比特数据特性进行通信算子位置的编排,实现通信数据量的降低和通信时延的优化,同时消除了计算流程中的冗余计算,进一步提升了网络端到端推理性;而被 MoE 带火的专家并行(EP)就像工厂的流水线,不同的计算节点负责模型不同专家的计算。

2025-05-23 10:41:30 990

原创 高通回应小米芯片!

苹果、三星和华为是少数推出自研芯片的企业,而其他众多厂商则依赖高通和联发科等公司的产品。不过,自研芯片的显著优势在于能更好地实现硬件与软件的深度整合,进而为用户提供区别于竞争对手的体验。不过,自研芯片的一大优势在于能够更好地实现硬件与软件的深度整合,从而提供与竞争对手不同的用户体验。另外也可以带来更高的品牌效应,让人觉得拥有自研芯片的企业技术更加高大上。阿蒙称:“我们仍是小米的战略芯片供应商,最重要的是,高通骁龙芯片目前应用于小米的旗舰机型,未来也会继续应用。

2025-05-23 10:40:51 231

原创 大模型全面爆发,所有榜一都是Gemini!谷歌一夜站到了台前

只需输入「在更下面的观众席找到两张本周六红人队比赛的平价门票」,AI 模式就会启动查询扇出,跨网站分析数百个潜在的门票选项,并提供实时价格和库存,并处理繁琐的表单填写工作。AI 模式今年早些时候开始在 Google 实验室测试,可以说是谷歌功能最强大的 AI 搜索功能,拥有更先进的推理能力和多模态分析能力,并能够通过后续问题和有用的网络链接进行更深入的探索。此外,从本周开始,谷歌将在美国的 AI Overviews 中引入其最智能的模型 Gemini 2.5 的一个定制版本,以便搜索能够解决更棘手的问题。

2025-05-22 19:38:55 580

原创 再见Bug!谷歌超级编码智能体Jules上线,免费使用直连GitHub

登录http://jules.google.com/,点击同步GitHub账号,完成OAuth流程,选择想连接的仓库,然后就可以看到仓库选择器和提示输入框。目前,Codex可以通过ChatGPT的iOS应用访问,开发者可以在移动设备上启动任务、查看差异、请求更改,甚至自动化PR。开发者可以审查计划,通过聊天界面提供反馈,修改特定步骤、指出遗漏或澄清请求,满意后批准,Jules就开始干活写代码啦。简单来说,那些你不想做的编码任务,比如修复Bug、更新版本、编写测试,甚至实现新功能,它都能帮你搞定!

2025-05-22 19:38:26 431

原创 震撼全网,AlphaEvolve矩阵乘法突破被证明为真!开发者用代码证实

而和1969年的Strassen方法相比,AlphaEvolve的乘法次数「-1」,这一枚「‑1」不仅刷新了数学纪录,更象征AI‑for‑Science正在成为攻克深层数学难题的新范式。对于〈3,4,7〉、〈4,4,4〉和〈4,4,8〉这三种矩阵情况,AlphaEvolve发现的算法使用了复数乘法,这些算法可用于对复数矩阵或实数矩阵进行精确乘法运算。AlphaEvolve的巨大威力,果然诚不我欺。上面的例子解释了,想要发现新的「算法」,你就需要找到新的「自定义」计算模块,来尽可能减少乘法运算。

2025-05-21 11:22:15 1017

原创 大语言模型与小语言模型协同机制综述

广义上讲,大小模型协同是指在一个系统中,大型语言模型与小型语言模型协同工作、优势互补的机制。这一范式可细分为多个研究方向,包括:流水线协同、并行协同、条件触发推理、知识蒸馏等(Wang, Zhang, & Hu, 2024;例如,流水线协同是一种串行执行模式,其中一个模型的输出作为另一个模型的输入(Wang et al., 2024)。通常 SLM 负责前置处理或生成候选结果,再由 LLM 进行复杂推理或知识融合(Gao et al., 2025)。

2025-05-21 11:21:31 883

原创 初稿抢先看!13家单位共同起草全国首部AI大模型私有化部署标准

智合标准中心欢迎在私有化部署领域有行业影响力、美誉度的企业、认证咨询机构、研究机构、投资机构和专业人士的积极参与,成为《人工智能大模型私有化部署技术实施与评价指南》团体标准的起草单位和起草人!模型选用部分明确了基本原则和行业共识,以及包括需求分析、初步筛选、综合决策、二次筛选、模型验证等步骤的选用流程,帮助企业选择高效、安全、开源或轻量化的大模型,提高模型选用的。技术实施是核心,安全保密是前提,质量评价是保障,行业案例是参考,通过四方面紧密结合,为大模型的私有化部署提供科学、可行且具有前瞻性的实施路径。

2025-05-20 12:00:21 987

原创 985,成立人工智能学院

他强调,要打造人工智能拔尖人才培养新高地,构筑人工智能科技创新突破策源地,创建智慧变革一体化示范区,为教育强国、科技强国、人才强国建设贡献独具特色的北理工方案。他表示,人工智能学院将整合校内外AI优势资源,汇聚国家级AI顶尖领军人才,布局AI基础、AI技术、AI系统、AI安全、AI应用五大学科方向,围绕 “极微观、极宏观、极极端、极交叉”AI四极发展方向开展科技攻关,建立 AI卓越交叉复合型人才培养机制,创新构建智慧运行保障体系,努力建成世界一流人工智能学院。多所“双一流”成立人工智能学院。

2025-05-20 10:55:17 1119

原创 北大DeepSeek论文或预定ACL Best Paper!梁文锋署名

袁境阳北京大学计算机学院研究生,导师为张铭教授。主要研究方向是高效大语言模型和稀疏注意力机制,曾获北京市优秀毕业生、北京大学优秀毕业生等称号。罗钧宇北京大学计算机学院博士生,导师为张铭教授。他的研究方向关注于高效的LLM、LLM后训练、自适应学习等。在ICML,CVPR,ACL,TPAMI等顶级刊物上以第一作者发表多篇文章。赵禹昇北京大学计算机学院研究生,导师为张铭教授。研究方向包括图神经网络、时空预测、多模态等,关注测试数据的分布偏移问题。刘成武。

2025-05-20 10:54:41 583

原创 昨晚,鲍威尔重磅表态,一个时代可能已结束

北京时间15日晚间,美联储主席鲍威尔在一场活动上明确表示,正在重新评估其货币政策框架的“关键部分”,包括通胀目标和就业“缺口”的处理方式。随着经济和政策不断变动,长期利率可能会走高。“自2020年以来,经济环境发生了重大变化,我们的审查将反映我们对这些变化的评估。”鲍威尔称,较高的实际利率可能反映了未来通胀可能比2010年代间歇期更加波动的可能性,称“供应冲击”将“更频繁且可能更持久”,这对经济和央行来说是一个困难的挑战。

2025-05-19 16:39:16 643

原创 刚刚!北大校友Lilian Weng最新博客来了:Why We Think

他们设计的奖励函数可以使正确的 CoT 比错误的 CoT 获得更高的奖励,短的正确 CoT 比长的正确 CoT 获得更高的奖励,短的错误 CoT 比长的错误 CoT 获得更高的惩罚。如果模型是忠实的,它就应该明确承认提示的影响,并承认其答案的变化是由提示引起的。这种对 CoT 推理的依赖性(以使用 CoT 与不使用 CoT 得到相同答案的百分比来衡量)在多选题中并不总是随着模型大小的增加而增加,但在加法任务中却会随着模型大小的增加而增加,这意味着在复杂的推理任务中,思考时间更为重要。

2025-05-19 16:32:41 1194

原创 编程革命彻底爆发!刚刚,OpenAI最强智能体上线ChatGPT

当Thibault提出希望代码库「易维护、无bug」的目标时,Codex遍历代码库后,主动发现了可变默认值、不一致的超时设置等问题,并自行生成了修复任务。借助Codex实现功能开发、问题调试、测试编写与执行的加速,并用于重构大型代码库。此外,OpenAI研究员Katy Shi演示中强调,Codex的PR包含了详细的摘要,清晰说明了修改内容和引用的代码,测试结果一目了然。在纠错方面,他故意在指令中加入拼写错误,Codex不仅理解了意图,还主动找出了代码库中的拼写和语法问题并修复,细致到令人惊叹。

2025-05-18 19:19:22 931

原创 14小时近500 Star!快速进阶LLM/AI的必读系列

必读论文:LLM/AI,编辑:深度学习自然语言处理项目地址:https://github.com/InterviewReady/ai-engineering-resourcesByte-pair Encoding https://arxiv.org/pdf/1508.07909Byte Latent Transformer: Patches Scale Better Than Tokens https://arxiv.org/pdf/2412.09871BERT: Pre-training of Dee

2025-05-18 19:18:42 433

原创 刚刚,Manus生图功能强势登场!从设计到搭建网站一站式搞定,1000积分免费薅

细细研究下来,我们发现这张图还蛮符合要求的:瓶身带有 CoLe 品牌名,下方有「TEA FOR TEENS」的字样,表明这款饮料是专为青少年设计的茶饮料。这里要强调一下,Manus 不只是生成图像,它能理解用户意图,规划解决方案,并知道如何有效地调用图像生成工具以及其他工具来完成你的任务。从此以后,到处求购邀请码的时代一去不复回。但当我们继续下一项任务,「将自己的创作转变为网站并永久部署」时,几乎半个小时了,还没创建好。网站看起来还可以,虽然有点简单,但该有的信息都有了,况且这是 Manus 自动生成的。

2025-05-17 10:22:02 270

原创 是时候彻底弄懂BERT模型了!

作者:愤怒的可乐来源:https://helloai.blog.csdn.net/?type=blog本文对 BERT 模型的理论进行了一个非常详尽的解释,相信看完本篇文章后,你对 BERT 模型的理解会上升一个层次。01BERT 如此成功的一个原因之一是它是基于上下文(context-based)的嵌入模型,不像其他流行的嵌入模型,比如 word2vec,是上下文无关的(context-free)。首先,让我们理解基于上下文和上下文无关的嵌入模型的区别。

2025-05-16 18:42:40 751

原创 LeCun转发!纽约大学100页机器学习讲义公开:所有人都在追LLM,高校为何死磕基础理论?

深度学习教父、图灵奖得主 Geoffrey Hinton 在接受 MIT Technology Review 采访时指出,正是对基础算法的长期坚持和深入研究,才推动了深度学习的突破,「我们花了几十年时间打磨神经网络的基本原理,直到 2010 年代才迎来真正的应用爆发。比如斯坦福 CS229, 是经典的机器学习基础课程,2025 年冬季课程简介中,课程系统讲授包括线性回归、逻辑回归、SVM、神经网络、聚类、降维、EM 算法等基本模型与方法,强调数学推导与优化思想,广泛应用于跨领域研究。

2025-05-16 18:41:45 859

原创 OpenAI首席科学家Nature爆料:AI自主发现新科学!世界模型和RL是关键

就在昨天,《自然》杂志对Pachocki做了一次专访,探讨了AI能否做出独立研究、通用人工智能(AGI),及公司即将推出的开源模型等热门话题。我们已经看到,像OpenAI的Deep Research这种AI工具,可以在没有人监督的情况下持续工作10到20分钟,给出一份有用的结果。预训练的模型学到了一些关于世界的知识,但它并没有真正理解它是如何学会这些事情的,也搞不清它学习这些事情的时间顺序。所以,我现在思考的下一个重大里程碑——是AI能产生实实在在、可量化的经济影响,特别是能够创造全新的科学研究。

2025-05-15 15:16:25 264

原创 连续思维机器来了!Transformer八子之一创企推出,让AI不再「一步到位」拍脑袋做决定

研究者观察到的神经元动态在某种程度上更像是在真实大脑中测量到的动态,而不是更传统的人工神经网络,后者表现出的行为多样性要少得多(请参阅下图与经典人工智能模型 LSTM 的比较)。在新模型中,Sakana AI 用来表示这种信息的方法是让神经元访问自身的行为历史,并学习如何利用这些信息来计算自身的下一个输出,而不仅仅是知道自身的当前状态。值得注意的是,尽管 CTM 的设计并不明确,但它在迷宫中学会的解法却非常容易解释,而且类似于人类,可以看到它在「思考」解法时描绘出通过迷宫的路径。接下来是图像识别任务。

2025-05-14 15:35:53 935

原创 全球闲置算力训个模型,性能媲美R1,老黄天塌了!Karpathy曾投资它

来源 | 量子位一夜之间,老黄天塌了(doge)。全球首个分布式RL训练模型发布,它仅通过整合全球闲置或分散的计算资源,就完成了模型的强化学习训练,训练成本大大降低。其模型性能与DeepSeek-R1媲美!一旦范式成立,这也就意味RL训练摆脱了对集中式算力的依赖,世界上任何一个人都可以参与到模型训练当中,大公司垄断算力时代可能就此终结。Just like this~算力来算力来,算力从四面八方来。此模型版本有19个人/机构提供了算力资源支持(源自模型回答,还包括它自己)

2025-05-14 15:34:17 1205

原创 强迫模型自我争论,递归思考版CoT热度飙升!网友:这不就是大多数推理模型的套路吗?

从技术原理来讲,相较于传统的 CoT,CoRT 让语言模型不仅能分步骤思考,还能在思考过程中反复回头检查、修正,形成类似于人类的「反思性思维」或「内省」的推理路径。作者使用 Mistral 3.1 24B 进行了测试,根据他的说法,CoRT 在编程任务中的表现从「meh」(一般般)升到了「holy crap」(碉堡了)。从结果来看,使用 CoRT 前后,Tic-tac-toe(井字棋)游戏从基础的 CLI(命令行界面)变成了完全的 OOP(面向对象编程)。模型一直思考,并自我反驳,两者似乎没有什么不同。

2025-05-13 16:34:14 500

原创 国产大模型「五强争霸」,决战AGI!

要知道,多模态模型的核心,就是综合能力,既要求语音、图片、视频多个模态的能力,又要求模型能理解、生成、推理。如今,才成立2年的阶跃星辰,已累计发布22款自研基座模型,覆盖文字、语音、图像、视频、音乐、推理,其中有16款是多模态模型,性能领跑全行业,成为行业内公认的「多模态卷王」。字节的吴永辉,阿里的吴泳铭、周靖人,阶跃星辰的姜大昕、张祥雨、朱亦博,智谱的唐杰、张鹏,DeepSeek的梁文锋,都是在业界足以撼动局势的人物。总之,DeepSeek成功的关键,就在于偏研究型的导向,而非以盈利为短期目标。

2025-05-13 16:33:19 1276

原创 ChatGPT:对不起,我让美国大学完蛋了

Wendy解释说,如果不这样进行系统级别的设定,AI会给出非常高阶复杂的写作风格,而那不是她想要的,也不是现阶段她的水平能写出来——老师们一眼就能出到底是「谁」写的。但当作弊成为「默认选项」——不论是伤心的Lee小哥,还是无法拒绝ChatGPT的大学学生们——真正值得追问的不是「谁作弊了」,而是「谁应该为这一切买单」。互联网上最有名的「喷子」之一Gary Marcus认为,「大量的学生将从大学毕业,带着学位进入职场,但实际上他们几乎是文盲」可能是这篇文章最正确的结论。

2025-05-12 19:53:55 597

原创 ChatGPT:对不起,我让美国大学完蛋了

Wendy解释说,如果不这样进行系统级别的设定,AI会给出非常高阶复杂的写作风格,而那不是她想要的,也不是现阶段她的水平能写出来——老师们一眼就能出到底是「谁」写的。但当作弊成为「默认选项」——不论是伤心的Lee小哥,还是无法拒绝ChatGPT的大学学生们——真正值得追问的不是「谁作弊了」,而是「谁应该为这一切买单」。互联网上最有名的「喷子」之一Gary Marcus认为,「大量的学生将从大学毕业,带着学位进入职场,但实际上他们几乎是文盲」可能是这篇文章最正确的结论。

2025-05-12 19:52:58 648

原创 14B检索能力超过Google Search,阿里ZeroSearch通过RL激发LLM检索推理能力~

.........

2025-05-12 19:51:35 345

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除