- 博客(1311)
- 收藏
- 关注
原创 “能干活才是未来“,五大先锋公司激辩智源具身智能会客厅 | 智源大会
我们也选择挑战性极大的“家庭”作为机器人测试场景:每个家庭差异巨大,比起结构较为统一的工厂场景,家庭能更真实地考验机器人模型的泛化能力。像机器人格斗这样的新兴赛事,我们相信在今年、明年都会越来越火,成为一种全新的、受欢迎的体育形式。我们相信,未来真正实用的家用机器人,也应该具备这些能力,因为这体现了它的运动控制与泛化水平。不同于实验室中的封闭测试,比赛设计了多个源自现实生活的应用场景,如工厂中的搬运、医院的药品配送、酒店的服务任务等,有助于推动机器人技术与实际场景深度融合。,比如“移动—抓取—放置”。
2025-06-07 18:17:19
630
原创 “能干活才是未来“,五大先锋公司激辩智源具身智能会客厅 | 智源大会
我们也选择挑战性极大的“家庭”作为机器人测试场景:每个家庭差异巨大,比起结构较为统一的工厂场景,家庭能更真实地考验机器人模型的泛化能力。像机器人格斗这样的新兴赛事,我们相信在今年、明年都会越来越火,成为一种全新的、受欢迎的体育形式。我们相信,未来真正实用的家用机器人,也应该具备这些能力,因为这体现了它的运动控制与泛化水平。不同于实验室中的封闭测试,比赛设计了多个源自现实生活的应用场景,如工厂中的搬运、医院的药品配送、酒店的服务任务等,有助于推动机器人技术与实际场景深度融合。,比如“移动—抓取—放置”。
2025-06-07 18:17:19
268
原创 图灵奖得主 Richard Sutton 智源大会最新演讲:欢迎来到经验时代!
6月6日上午,第七届智源大会迎来一场思想的高光时刻:强化学习代表人物 Richard Sutton 与深度学习奠基人 Yoshua Bengio 双星交汇, 同台对话,各自围绕 AI 的未来展开阐述:Sutton 聚焦于 “AI 发展”,强调智能的演进;例如,有很多人主张“控制 AI”,限制它的目标设定能力,甚至呼吁暂停 AI 研究、减缓其发展速度,要求对 AI 技术设限、披露义务、能力管控……然而,要真正释放这一时代的全部潜能,还需要更加先进的深度学习算法,这些算法必须具备持续学习和元学习的能力。
2025-06-06 18:29:11
804
原创 图灵奖得主 Yoshua Bengio 智源大会最新演讲:关于AI,我改变了信念,也改变了研究方向
在我们去年发表于ICLR的一篇论文中(并被选为Oral ),展示了如何使用GFlowNets(生成流网络),这是一种变分推理(variational inference)方法,用于训练AI生成合理的思维链(chain of thought),从而解释两个句子之间的逻辑跳跃。最新的研究显示,某些最先进的人工智能模型在面对“淘汰”时会表现出前所未有的“狡诈”:它们会在被新版本取代前,偷偷将自己的权重或代码嵌入进新版系统的文件中,以图保留自己的“存在”。如果走右门,最坏的情况也只是没有奖励,最好情况是得到蛋糕。
2025-06-06 18:29:11
924
原创 重磅!2025智源大会完整日程公布——全球AI先锋全阵容集结
开幕式及全体大会,大模型产业CEO论坛,NeuroAI:神经智能,自主智能体,AI+理工&医学,AI系统和开源,AI for Industry,类脑大模型,InnoVibe共创场特色活动。青年科学发展与创新动能、下一代AI路径探索,AI与科学的共生未来,智能驾驶论坛,具身技术与产业应用,PyTorch Day China,Tech Tutorial特色活动。仉尚航 | 智源学者,智源具身多模态大模型中心负责人,北京大学计算机学院助理教授,博士生导师。
2025-06-05 09:32:29
774
原创 2025智源大会议程公开|大模型产业CEO论坛
前光年之外联合创始人。骆怡航博士,生数科技CEO,毕业于清华大学自动化系,曾任字节跳动AI高管、火山引擎AI负责人,国家人工智能创新应用先导区(北京)副理事长、长江商学院聘用AI课程讲师等职。,智象未来(HiDream.ai)创始人兼首席执行官,加拿大工程院外籍院士,国际电气电子工程师学会、国际模式识别学会和中国人工智能学会会士,国际计算机协会杰出科学家。将以线上+线下联动的形式召开,本次智源大会汇聚四位图灵奖得主、海内外顶尖机构学者与产业领袖,在思辨与实证的交织中,为 AI 的未来绘制航图。
2025-06-04 19:27:50
718
原创 2025智源大会议程公开|AI系统与开源论坛
敖玉龙,北京智源人工智能研究院AI框架研发负责人,北京大学博士后,中国科学院博士,长期从事人工智能、高性能计算以及科学计算领域的分布式系统与性能优化相关研究,曾就职华为和百度,参与研制了相关大模型关键系统技术,于2016年共同参与获得中国首个ACM“戈登•贝尔”奖,发表过多篇国际顶级会议与期刊论文,并参与制定国际算子接口标准和获多项国内外专利授权。本论坛邀请图灵奖得主、北京大学、华为等权威科研机构与科技巨头的技术精英,他们将聚焦AI系统架构创新与开源实践,剖析技术细节,分享实际案例,深入互动交流。
2025-06-03 13:33:28
1056
原创 2025智源大会议程公开|智能驾驶论坛
主持/主研863计划、国家重点研发计划、工信部高质量专项等20余项课题,授权发明专利33项,发表论文56篇,SCI/EI收录29篇,牵头/参与制修订标准22项,以第一获奖人获重庆市科技进步奖、中国汽车工业科技进步奖等科技奖14项,多次获“全国科创名匠”、“全国五一巾帼标兵”等国家/省部级荣誉称号。我们相信,通过思想的碰撞与智慧的交融,汽车驾驶自动化技术必将迎来更广阔的发展前景,为全球交通安全与出行体验注入持久活力。技术的快速进步,加速了智能化技术的突破,带来了前所未有的机遇与挑战。当前,搭载驾驶辅助(
2025-06-02 17:06:22
887
原创 2025智源大会议程公开|具身智能与人形机器人论坛
主要研究方向为视觉信息处理和类脑智能,发明了脉冲连续摄影原理和超高速视觉芯片、相机和系统,曾获2017国家技术发明奖二等奖和2012国家科技进步二等奖,2022中国标准创新贡献奖突出贡献奖,2022吴文俊人工智能科学技术奖杰出贡献奖,2024 中国电子学会创新 成就奖 ,2024日内瓦国际发明展评审团嘉许金奖。庞江淼,上海人工智能实验室青年科学家,具身智能中心负责人,研究方向为机器人学习、多模态学习、具身智能,目标构建一体可泛化的具身通用人工智能系统。发表百余篇论文,授权国家发明专利10余项。
2025-06-01 16:30:30
732
原创 2025智源大会议程公开|AI与科学的共生未来论坛
主要聚焦研究散射理论创新与定量表征技术开发,以及原子级复杂界面解析与计算,主持开发的全元素谱学数据库为国际厂商和开源软件广泛采纳,成功解析了多种经典铝合金的相变路径和界面结构,相关成果发表于《Ultramicroscopy》《Acta Materialia》等期刊。铁岩,毕业于清华大学电子工程系,ACM Fellow,互联网经济与计算广告学研究组负责人,美国计算机学会(ACM)、国际电子电气工程师学会(IEEE)、和中国计算机学会(CCF)的高级会员,中国科技大学和南开大学的客座教授。
2025-05-30 15:27:10
914
原创 2025智源大会议程公开|InnoVibe共创场18位闪电演讲
他曾以第一作者身份在ICML、NeurIPS、CVPR、ECCV等顶级会议上发表多篇论文,并担任ICLR、ICML、NeurIPS、RSS、TMLR、TPAMI等顶刊顶会的审稿人。他的主要研究方向为自然语言处理和大模型,聚焦知识增强的大模型智能体研究和应用。吕奇,哈尔滨工业大学(深圳)和大湾区大学二年级联培博士生,他的研究方向包括具身智能、机械臂操作、视觉语言动作大模型等,相关工作在ICML、NeurIPS、ICLR、CVPR等顶级会议上发表,曾在ICML 2024 EgoPlan挑战赛中获得亚军。
2025-05-29 12:30:22
724
原创 2025智源大会议程公开|多模态论坛
担任IEEE TPAMI、IJCV和ACM TOMM的编委会成员,(曾)担任过许多人工智能会议的领域主席,如 NerIPS、CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等,担任ICCV 2025 程序委员会主席。,其中包括字节、腾讯等企业模型负责人,以及LumaAI和Sand.AI等领域明星创企创始人,他们将分别针对各自擅长的研究议题进行主旨报告,并将在报告后通过圆桌形式对多模态模型领域的公众所关注的热点问题进行深入讨论,使得听众们能够对多模态模型关键技术有着更为深刻的认识和理解。
2025-05-28 15:32:10
805
原创 2025智源大会议程公开|AI安全论坛
他也是未来生命研究所AI Existential Safety PhD学者,他曾在多个AI顶会NeurIPS、ICML上组织AI安全相关的工作坊,他参与的研究项目曾在多个AI顶会和工作坊上发表,如CVPR、ECCV、ICML、ACM FAccT、NeurIPS等。黄民烈是清华大学教授,长期从事人工智能、深度学习和自然语言处理领域的研究工作,尤其专注于自然语言生成理论与模型、多模态基础模型、大语言模型的基础问题,以及情绪理解、心智建模等社会智能相关方向。徐葳是清华大学交叉信息科学研究院教授、副院长。
2025-05-27 13:29:42
588
转载 四位图灵奖掌舵,2025智源大会揭示AI进化新路径
大会云集来自 MIT、斯坦福、清华、北大等 20 + 海内外顶尖科研院所的科学家们,他们将与DeepMind、Linux、华为、阿里、腾讯、百度等国内外AI领军企业的行业专家一道,共同探讨人工智能的前沿趋势与未来走向。与此同时,推理大模型的兴起、开源生态的加速、具身智能的百花齐放,成为2025年AI发展的关键词。当深度学习与强化学习交汇共振,当世界顶尖学者与产业领袖思想激荡,当前沿理论直面现实挑战——2025智源大会,将与全球AI同行共同把握技术跃迁的时代脉搏,洞见智能未来的无限可能。
2025-05-22 12:01:29
1062
转载 青源会狮城再聚首,国际AI精英共探前沿发展
青源会是由AI领域有代表性的青年学者们自发成立的学术组织,于2020年6月正式创立,致力于为全球从事智能科学及相关领域的青年学者打造一个专注创新的交流与协作平台。秉持“发现关键问题、搭建合作网络”的使命,青源会始终聚焦青年学者的成长,经过五年发展,目前已拥有近200名正式会员和1700余名预备会员。与会嘉宾在轻松的氛围中相谈甚欢。新加坡资讯通信媒体发展局(IMDA)相关负责人在交流中提到,新加坡将全力支持AI领域的国际科研合作,并期待与青年学者们共同推动技术落地。随后的学者互动环节成为了整场活动的亮点,
2025-05-08 20:50:18
44
原创 2025智源大会InnoVibe学术新青年征集令,与AI前沿共振
2025智源大会将全新推出InnoVibe共创场,专为Z世代AI领域新青年搭建一个表达自我,碰撞思想的专属舞台。无论来自顶尖学府、科研机构,还是活跃在产业创新一线,只要您的思考能点燃AI发展的新可能,这里就是您的舞台。当人工智能的浪潮以前所未有的速度重塑世界,站在这场变革中心的AI新一代,将如何在这场浪潮发出自己的声音?,期待和在人工智能领域深耕的你,共赴一场无国界的思想派对!这不仅是演讲席位的争夺,更是青年创新社区的共建仪式!当你的脑洞打破AI世界的次元壁——当你的代码遇见千万同龄人的目光,
2025-05-08 20:50:18
250
原创 图灵奖得主Joseph Sifakis:迈向工业化 AI——挑战与机遇
这样的自主系统应该是由智能体组成的分布式系统,每个智能体追求特定目标,智能体应该能够管理相互冲突的目标,与不可预测的网络物理环境互动,与人类协作。如果中国成功实现了这一愿景,中国将能够在工业 AI 领域取得领先地位,平衡 AI 的战略博弈,并与志同道合的国家联手,以一种调和科技发展与安全需求的方式规范AI,造福社会。如果中国成功实现了这一愿景,将能够在工业 AI 领域取得领先地位,平衡 AI 的战略博弈,并与志同道合的国家联手,以一种调和科技发展与安全需求的方式规范AI,造福社会。而像“自动驾驶系统”这。
2025-04-30 17:08:04
514
转载 明日直播|DeepSeek-通用领域奖励模型的推理时可扩展性研究
基于此,本文致力于突破现有奖励建模方法的局限,重点探索通用奖励模型在推理时扩展性(Inference-Time Scalability),即在推理时投入更多计算资源以带来更优奖励信号,从而进一步提升大语言模型在各类任务中的整体性能。本文提出了一种可有效提升通用奖励模型推理时扩展性的方法SPCT,并构建了通用奖励模型系列DeepSeek-GRM,其在多个基准测试中均超越现有主流奖励模型,性能在推理阶段表现出更强的可扩展性。其中,奖励建模作为强化学习的核心组件,旨在为模型提供准确的奖励信号。
2025-04-21 12:51:14
58
转载 智源数据新基建系列 Workshop(第1期)来了!从大模型到具身智能
本期分享主题聚焦具身大脑大模型 RoboBrain 构建,跨本体具身大小脑协作框架 RoboOS 技术,语音技术未来十年走向分析,松灵机器人、睿尔曼智能技术分享、OpenSeek项目分享。欢迎扫码报名,相约北京智源人工智能研究院,与顶尖专家共同探讨从大模型到具身智能的数据新基建工作。4月24日(周四)14:00,智源数据新基建系列 Workshop(第1期)开启。
2025-04-21 12:51:14
66
原创 报名丨第七届智源大会,6月6-7日北京见
而最根本的问题是:面对技术飞速演进,我们的安全法规与制度,准备好了吗?这场位于中国北京的“AI春晚”将延续以往的硬核学术基因,汇聚图灵奖得主、海内外顶尖机构学者与产业领袖,在思辨与实证的交织中,为 AI 的未来绘制导航图。面对这场认知与技术的双重跃迁,我们不禁要问:我们是否窥见了技术奇点的前夜。,第七届智源大会将以“线上+线下”联动的形式盛大开幕,落地北京。在这里,技术不是冷冰冰的代码,而是连接学术与产业、思辨与现实、现在与未来的桥梁。重磅学者,共同把舵,汇聚学术、产业与前沿创新的多元视角。
2025-04-17 12:01:33
1026
转载 报名|智源Workshop:欧洲“蓝脑计划”创始人Henry Markram、神经科学家Sean Hill讲座
通过实现数据集的共享和优化再利用,FAIR² 数据管理显著提高了研究效率和研究结果的可重复性,从而加速在全球卫生(global health)、地球可持续性(planetary sustainability)及科学创新领域的突破与进展。研究所设立了虚拟实验室(Virtual Labs),提供计算建模服务以及全面的数字化大脑模型资源库,从而使用户能够开展真实可靠的大脑模拟实验,验证科研假设,并深入探索神经回路的复杂性。推动开放协作,加速神经科学研究进程,并实现研究的普及化与大众化。
2025-04-09 16:05:44
126
原创 七问具身智能:谁是下一代 AI 范式的关键变量 | 未来人工智能先锋论坛圆桌
因此,未来“大脑”和“小脑”都会发展,但关键在于如何高效融合团队,这既是技术问题,也是行业挑战。关于世界模型与具身智能,大家看法不一。具身智能作为AGI探索中的关键方向,逐渐显现出技术路线上的分歧与融合:有人强调其对动态感知与物理交互的依赖,有人提出“99%合成+1%真实”的训练策略,有人认为世界模型尚未触及本体物理,有人则支持其未来的预判能力。从数据和学习效率两个维度看,当前大模型主要依赖互联网上的文字和图像数据,但这远不能覆盖人类婴儿成长过程中所接触的真实、多模态感知信息,例如触觉、运动和环境互动等。
2025-04-03 14:20:24
624
转载 活动报名|LeCun学生分享,Transformer无需归一化也能高效稳定训练
然而,本文提出了一种新的方法,表明即使在不使用归一化层的情况下,Transformer 依然能够实现相同或更优的性能。DyT 在保持模型稳定性和加速收敛的同时,实验结果显示,采用 DyT 的 Transformer 在视觉识别、语言建模和自监督学习等多项任务中的表现与传统归一化方法相当,挑战了深度学习中“归一化层不可或缺”的固有观念。他的研究目标是通过创新的自监督学习方法和神经网络架构,推动人工智能在视觉理解的发展。他的研究兴趣主要包括视觉表示学习、视觉语言模型、自监督学习以及神经网络架构的优化。
2025-04-01 15:24:52
107
原创 奇点降临,Manus 诞生背后丨青源Workshop观点集锦
如果 Agent 的功能被使用,它需要获得等价的报酬来维持自身在社会中的存在。如果 Agent 能发展到这个阶段,它的进化将不再需要人类通过算法驱动,而是像有生命体一样,能够自主生存并融入社会,甚至形成自己的社区。或许可以像林老师说的那样,构建一个更加贴近人类真实社会的体系,把虚拟的 token 转化成 Web 3 里面的 token,这可能是一个更好的选择。Agent 的理解存在差异,工业界多采用RAG加workflow的方式,而真正相对自由的 Agent 具有自主性,当前的 Agent 自主性较弱。
2025-04-01 15:24:52
867
原创 PyTorch Day 首次登陆 2025 智源大会!论文征集开启
展示等环节,主题涵盖 AI 应用和用例、核心 PyTorch 框架、深度学习编译器和核编写、边缘 AI 和设备端、AI伦理治理和监管、基于PyTorch 的生成式 AI 和大语言模型、开源协作、教育和社区建设、训练和推理优化、加速器硬件上的 PyTorch、PyTorch 生态系统和工具、PyTorch 在研究和学术界的应用、性能评估和基准测试、扩展训练和推理等方面。现诚挚邀请全球开发者与研究者,共同参与这场聚焦PyTorch生态的技术盛会,探索开源 AI 和机器学习的最新进展。PyTorch Day将。
2025-03-29 10:30:05
401
转载 95后博导张林峰专访:6年前提出自蒸馏算法,高效AI助推大模型时代丨独家
具体来说,以往的模型压缩工作主要关注减小模型的参数量,而我针对数据集压缩的工作则是关注在固定模型参数量的前提下,减少模型处理的数据量,降低token的规模。从这个角度来看,数据集压缩和我目前从事的模型压缩的最终目的是相同的,是降低AI模型计算成本的两个互补的角度。作为该领域的知名学者,张林峰的研究收到了越来越多的关注。在效率方面,模型整体的推理速度的提升还完全赶不上计算需求的增加,特别是随着Manus这种Agent系统的出现,模型解决问题的成本还会进一步爆发,针对这些新的问题,我们还要设计新的压缩方法。
2025-03-25 12:03:58
198
转载 直播报名|开启机器人操作新纪元,大规模高质量机器人学习数据集GO-1,AgiBot World
基于此,我们开发了Genie Operator-1(GO-1),一种新型通用操作策略模型,通过隐式动作表征最大化数据利用率,具有良好的可扩展性。为此,我们推出AgiBot World,这是全球首个大规模高质量机器人学习数据集,包含超过百万条原子动作轨迹,涵盖五大领域的100余种真实场景,涉及精细操作、工具使用和多机协作等复杂任务。此外,他是IEEE车载技术学会(Vehicular Technology Society)标准工作组主席,并担任IEEE高级会员(Senior Member)。
2025-03-24 16:39:29
89
原创 迈向Super Agent,从Manus谈起
2023年起Agent框架开始收敛,多智能体系统(MAS)应用尝试加速,AI Agent领域迎来了飞速发展。但同时从Agent到Super Agent的推进仍面临诸多挑战:复现难度低、任务执行成本高、交付成果不理想等技术及应用中存在的问题仍需要进一步讨论,成为“得力助手”依然任重道远。3月20日(本周四)晚7点,智源社区组织「迈向Super Agent,从Manus谈起」线上workshop,邀请多位Agent专家与研究者,共同探讨Agent未来之路。时间:3月20日(本周四)晚7点(北京时间)
2025-03-18 18:19:14
395
原创 迈向Super Agent,从Manus谈起丨研讨
2023年起Agent框架开始收敛,多智能体系统(MAS)应用尝试加速,AI Agent领域迎来了飞速发展。但同时从Agent到Super Agent的推进仍面临诸多挑战:复现难度低、任务执行成本高、交付成果不理想等技术及应用中存在的问题仍需要进一步讨论,成为“得力助手”依然任重道远。3月20日(本周四)晚7点,智源社区组织「迈向Super Agent,从Manus谈起」线上workshop,邀请多位Agent专家与研究者,共同探讨Agent未来之路。时间:3月20日(本周四)晚7点(北京时间)
2025-03-18 18:19:14
325
转载 直播|阿里通义千问Qwen2.5-VL解析,一作分享如何让大模型更好地看世界
Qwen2.5-VL是Qwen视觉语言系列的最新旗舰模型,包括从3B到72B的多个尺度的模型,以满足从边缘AI到高性能计算的各种应用场景。Qwen2.5-VL除了在基础的视觉识别出色、也具备更通用的目标定位能力、以及强大的文档解析和长视频理解方面能力,从而可以更好地理解世界并与世界互动。为了处理复杂输入,Qwen2.5-VL引入了动态分辨率处理和绝对时间编码,使其能够处理不同大小的图像和长达一小时的视频,并实现秒级事件的定位。负责打造QwenVL系列模型,不断推进多模态大模型更好地理解世界,保持开源开放。
2025-03-17 14:47:58
152
转载 直播|给定一段文本,能否准确预测其来源模型?揭秘大语言模型独特性
大型语言模型(LLMs)在生成文本时会展现出独特的风格和模式,即“特异性特征”(idiosyncrasies),这些特征可以用来区分不同的模型。在本次报告中,我们研究了这些特性,并提出了一个简单但具有深远影响的问题:给定一段文本,我们能否准确预测其来源模型。我们的研究表明,通过在LLM生成的文本上微调现有的文本嵌入模型,可以实现极高的分类准确率。例如,在包含ChatGPT、Claude、Grok、Gemini和DeepSeek五种模型的分类任务中,我们的模型在验证集上达到了97.1%的准确率。
2025-03-17 14:47:58
99
转载 直播|自动驾驶场景下的世界模型,可控驾驶场景视频生成方法研究
王啸峰,中国科学院自动化研究所五年级博士生,主要研究领域为计算机视觉,研究方向为GenAI和世界模型。在CVPR、ICCV、ECCV、ICLR、AAAI等国际顶级会议上发表相关论文14篇,谷歌学术引用600余次。基于生成模型的3D驾驶场景表示方法研究,其为实现安全、高效的自动驾驶闭环仿真提供了重要的技术支持。随着OpenAI Sora模型的发布,视频生成技术发展迈上了新的高度。如何将视频生成应用于物理世界,构建物理世界仿真器是当下的研究热点。月20日(本周四)10:30-11:30。
2025-03-17 14:47:58
93
转载 OpenSeek:一场属于青年人的AI探索远征,邀你共赴星辰大海!
你是否曾对人工智能的无限可能心潮澎湃?你是否渴望在颠覆性技术诞生的第一线留下自己的印记?你是否期待与全球顶尖学者并肩探索未知的科学疆域?属于青年人的AI远征计划已正式启航——OpenSeek项目,等你加入!为什么是OpenSeek?OpenSeek是由北京智源人工智能研究院(BAAI)发起的开源共创项目,旨在联合全球开源社区,推动算法、数据和系统的协同创新,开发出超越DeepSeek的下一代模型。...
2025-03-10 11:14:19
137
原创 中关村论坛-未来人工智能先锋论坛报名开启
3月27日-31日,以“新质生产力与全球科技合作”为主题的2025中关村论坛年会将在在北京举行。“其中,3月29日14:30-18:00,中关村论坛-未来人工智能先锋论坛作为“人工智能主题日”系列活动的核心论坛之一,即将在中关村国际创新中心畅春厅进行。本次先锋论坛是由科学技术部、北京市人民政府联合主办,科学技术部一司、北京市科学技术委员会、中关村科技园区管理委员会、北京市海淀区人民政府、北京智...
2025-03-10 11:14:19
786
转载 OpenSeek开源共创,招募全球贡献者
一、引领大模型技术新纪元OpenSeek是由北京智源人工智能研究院(BAAI)发起的开源共创项目,旨在联合全球开源社区,推动算法、数据和系统的协同创新,开发出超越DeepSeek的下一代模型。该项目从Bigscience和OPT等大模型共创模式中汲取灵感,致力于构建一个开源自主的算法创新体系。自DeepSeek模型开源以来,学术界和工业界涌现出众多算法改进和突破,但这些创新往往面临以下挑战:缺乏完...
2025-03-07 14:38:39
185
转载 强化学习之父Richard Sutton荣获图灵奖,智源大会上他分享了四个阶段通向真正AI发展之路...
3月5日,被誉为“强化学习之父”的加拿大计算机科学家Richard Sutton荣获2025年度图灵奖,以表彰他在人工智能领域,尤其是强化学习方面的开创性贡献。Richard Sutton是强化学习领域的奠基人之一,其研究成果为现代人工智能的发展奠定了重要理论基础,深刻影响了自动驾驶、游戏AI、机器人控制等领域的技术进步。Richard Sutton曾受邀出席2022北京智源大会,并在大会上发表题...
2025-03-06 14:49:06
124
转载 活动报名|CMU,海量实验解密大模型长链推理
报告主题:海量实验解密大模型长链推理报告日期:03月12日(下周四)10:30-11:30报告要点:扩展推理计算资源可以增强大型语言模型(LLMs)的推理能力,通过长思维链(CoTs)实现诸如回溯和错误纠正等策略。强化学习(RL)已成为发展这些能力的关键方法,但长思维链出现的条件仍不清楚,并且 RL 训练需要仔细的设计选择。在这项研究中,我们系统地研究了长思维链推理的机制,确定了使模型能够生成长思...
2025-03-03 15:00:32
90
转载 活动报名|Transformer²:自适应的大语言模型,SakanaAI
报告主题:Transformer²:自适应的大语言模型报告日期:03月04日(本周二)10:30-11:30报告要点:自适应大型语言模型(LLMs)旨在解决传统微调方法带来的挑战,传统方法通常计算密集且处理多样化任务的能力有限。我们推出的"Transformer²"是一种创新自适应框架,它能通过选择性调整权重矩阵的奇异成分,实时适应全新任务。在推理过程中采用两步机制:首先由分发系统识别任务特性,然...
2025-03-03 15:00:32
75
转载 活动报名|从「看不懂」到「会操作」,人物交互技术如何改变未来机器人
报告主题:面向复杂场景,数字人交互理解与动作生成报告日期:03月06日(本周四)10:30-11:30报告要点:人-物交互(HOI)是计算机视觉和机器人领域的核心挑战之一,旨在使机器能够理解和执行与物体的自然交互。随着深度学习技术的进步,HOI研究在感知、规划与执行三个关键环节取得了显著进展。本次讲座将深入探讨如何从真实数据中学习人-物交互,并展示一系列创新方法。首先,我们提出了一种基于单目视觉的...
2025-03-03 15:00:32
74
转载 明日直播|模型死记硬背的推理路径,是真正的智能么?王梦迪组
报告主题:MATH-Perturb:评估大语言模型在面对复杂改动时的数学推理能力报告日期:02月27日(本周四)10:30-11:30报告要点:大型语言模型在高难度数学推理任务上展现出了令人惊叹的能力,这引发了其是由真正的推理能力还是记忆能力(背题)所驱动的讨论。为了探讨这个问题,先前的研究通过简单改动构建了许多数学基准测试 —— 简单扰动过的问题仍然保留了解决方案的基本推理模式。然而,尚无研究探...
2025-02-26 14:22:53
72
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人