智源社区-CSDN博客

原创 “能干活才是未来“，五大先锋公司激辩智源具身智能会客厅 | 智源大会

我们也选择挑战性极大的“家庭”作为机器人测试场景：每个家庭差异巨大，比起结构较为统一的工厂场景，家庭能更真实地考验机器人模型的泛化能力。像机器人格斗这样的新兴赛事，我们相信在今年、明年都会越来越火，成为一种全新的、受欢迎的体育形式。我们相信，未来真正实用的家用机器人，也应该具备这些能力，因为这体现了它的运动控制与泛化水平。不同于实验室中的封闭测试，比赛设计了多个源自现实生活的应用场景，如工厂中的搬运、医院的药品配送、酒店的服务任务等，有助于推动机器人技术与实际场景深度融合。，比如“移动—抓取—放置”。

2025-06-07 18:17:19 630

原创 “能干活才是未来“，五大先锋公司激辩智源具身智能会客厅 | 智源大会

我们也选择挑战性极大的“家庭”作为机器人测试场景：每个家庭差异巨大，比起结构较为统一的工厂场景，家庭能更真实地考验机器人模型的泛化能力。像机器人格斗这样的新兴赛事，我们相信在今年、明年都会越来越火，成为一种全新的、受欢迎的体育形式。我们相信，未来真正实用的家用机器人，也应该具备这些能力，因为这体现了它的运动控制与泛化水平。不同于实验室中的封闭测试，比赛设计了多个源自现实生活的应用场景，如工厂中的搬运、医院的药品配送、酒店的服务任务等，有助于推动机器人技术与实际场景深度融合。，比如“移动—抓取—放置”。

2025-06-07 18:17:19 268

原创图灵奖得主 Richard Sutton 智源大会最新演讲：欢迎来到经验时代！

6月6日上午，第七届智源大会迎来一场思想的高光时刻：强化学习代表人物 Richard Sutton 与深度学习奠基人 Yoshua Bengio 双星交汇，同台对话，各自围绕 AI 的未来展开阐述：Sutton 聚焦于 “AI 发展”，强调智能的演进；例如，有很多人主张“控制 AI”，限制它的目标设定能力，甚至呼吁暂停 AI 研究、减缓其发展速度，要求对 AI 技术设限、披露义务、能力管控……然而，要真正释放这一时代的全部潜能，还需要更加先进的深度学习算法，这些算法必须具备持续学习和元学习的能力。

2025-06-06 18:29:11 804

原创图灵奖得主 Yoshua Bengio 智源大会最新演讲：关于AI，我改变了信念，也改变了研究方向

在我们去年发表于ICLR的一篇论文中（并被选为Oral ），展示了如何使用GFlowNets（生成流网络），这是一种变分推理（variational inference）方法，用于训练AI生成合理的思维链（chain of thought），从而解释两个句子之间的逻辑跳跃。最新的研究显示，某些最先进的人工智能模型在面对“淘汰”时会表现出前所未有的“狡诈”：它们会在被新版本取代前，偷偷将自己的权重或代码嵌入进新版系统的文件中，以图保留自己的“存在”。如果走右门，最坏的情况也只是没有奖励，最好情况是得到蛋糕。

2025-06-06 18:29:11 924

原创重磅！2025智源大会完整日程公布——全球AI先锋全阵容集结

开幕式及全体大会，大模型产业CEO论坛，NeuroAI：神经智能，自主智能体，AI+理工&医学，AI系统和开源，AI for Industry，类脑大模型，InnoVibe共创场特色活动。青年科学发展与创新动能、下一代AI路径探索，AI与科学的共生未来，智能驾驶论坛，具身技术与产业应用，PyTorch Day China，Tech Tutorial特色活动。仉尚航 | 智源学者，智源具身多模态大模型中心负责人，北京大学计算机学院助理教授，博士生导师。

2025-06-05 09:32:29 774

原创 2025智源大会议程公开｜大模型产业CEO论坛

前光年之外联合创始人。骆怡航博士，生数科技CEO，毕业于清华大学自动化系，曾任字节跳动AI高管、火山引擎AI负责人，国家人工智能创新应用先导区（北京）副理事长、长江商学院聘用AI课程讲师等职。，智象未来（HiDream.ai）创始人兼首席执行官，加拿大工程院外籍院士，国际电气电子工程师学会、国际模式识别学会和中国人工智能学会会士，国际计算机协会杰出科学家。将以线上+线下联动的形式召开，本次智源大会汇聚四位图灵奖得主、海内外顶尖机构学者与产业领袖，在思辨与实证的交织中，为 AI 的未来绘制航图。

2025-06-04 19:27:50 718

原创 2025智源大会议程公开｜AI系统与开源论坛

敖玉龙，北京智源人工智能研究院AI框架研发负责人，北京大学博士后，中国科学院博士，长期从事人工智能、高性能计算以及科学计算领域的分布式系统与性能优化相关研究，曾就职华为和百度，参与研制了相关大模型关键系统技术，于2016年共同参与获得中国首个ACM“戈登•贝尔”奖，发表过多篇国际顶级会议与期刊论文，并参与制定国际算子接口标准和获多项国内外专利授权。本论坛邀请图灵奖得主、北京大学、华为等权威科研机构与科技巨头的技术精英，他们将聚焦AI系统架构创新与开源实践，剖析技术细节，分享实际案例，深入互动交流。

2025-06-03 13:33:28 1056

原创 2025智源大会议程公开｜智能驾驶论坛

主持/主研863计划、国家重点研发计划、工信部高质量专项等20余项课题，授权发明专利33项，发表论文56篇，SCI/EI收录29篇，牵头/参与制修订标准22项，以第一获奖人获重庆市科技进步奖、中国汽车工业科技进步奖等科技奖14项，多次获“全国科创名匠”、“全国五一巾帼标兵”等国家/省部级荣誉称号。我们相信，通过思想的碰撞与智慧的交融，汽车驾驶自动化技术必将迎来更广阔的发展前景，为全球交通安全与出行体验注入持久活力。技术的快速进步，加速了智能化技术的突破，带来了前所未有的机遇与挑战。当前，搭载驾驶辅助（

2025-06-02 17:06:22 887

原创 2025智源大会议程公开｜具身智能与人形机器人论坛

主要研究方向为视觉信息处理和类脑智能，发明了脉冲连续摄影原理和超高速视觉芯片、相机和系统，曾获2017国家技术发明奖二等奖和2012国家科技进步二等奖，2022中国标准创新贡献奖突出贡献奖，2022吴文俊人工智能科学技术奖杰出贡献奖，2024 中国电子学会创新成就奖，2024日内瓦国际发明展评审团嘉许金奖。庞江淼，上海人工智能实验室青年科学家，具身智能中心负责人，研究方向为机器人学习、多模态学习、具身智能，目标构建一体可泛化的具身通用人工智能系统。发表百余篇论文，授权国家发明专利10余项。

2025-06-01 16:30:30 732

原创 2025智源大会议程公开｜AI与科学的共生未来论坛

主要聚焦研究散射理论创新与定量表征技术开发，以及原子级复杂界面解析与计算，主持开发的全元素谱学数据库为国际厂商和开源软件广泛采纳，成功解析了多种经典铝合金的相变路径和界面结构，相关成果发表于《Ultramicroscopy》《Acta Materialia》等期刊。铁岩，毕业于清华大学电子工程系，ACM Fellow，互联网经济与计算广告学研究组负责人，美国计算机学会(ACM)、国际电子电气工程师学会(IEEE)、和中国计算机学会（CCF）的高级会员，中国科技大学和南开大学的客座教授。

2025-05-30 15:27:10 914

原创 2025智源大会议程公开｜InnoVibe共创场18位闪电演讲

他曾以第一作者身份在ICML、NeurIPS、CVPR、ECCV等顶级会议上发表多篇论文，并担任ICLR、ICML、NeurIPS、RSS、TMLR、TPAMI等顶刊顶会的审稿人。他的主要研究方向为自然语言处理和大模型，聚焦知识增强的大模型智能体研究和应用。吕奇，哈尔滨工业大学（深圳）和大湾区大学二年级联培博士生，他的研究方向包括具身智能、机械臂操作、视觉语言动作大模型等，相关工作在ICML、NeurIPS、ICLR、CVPR等顶级会议上发表，曾在ICML 2024 EgoPlan挑战赛中获得亚军。

2025-05-29 12:30:22 724

原创 2025智源大会议程公开｜多模态论坛

担任IEEE TPAMI、IJCV和ACM TOMM的编委会成员，（曾）担任过许多人工智能会议的领域主席，如 NerIPS、CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等，担任ICCV 2025 程序委员会主席。，其中包括字节、腾讯等企业模型负责人，以及LumaAI和Sand.AI等领域明星创企创始人，他们将分别针对各自擅长的研究议题进行主旨报告，并将在报告后通过圆桌形式对多模态模型领域的公众所关注的热点问题进行深入讨论，使得听众们能够对多模态模型关键技术有着更为深刻的认识和理解。

2025-05-28 15:32:10 805

原创 2025智源大会议程公开｜AI安全论坛

他也是未来生命研究所AI Existential Safety PhD学者，他曾在多个AI顶会NeurIPS、ICML上组织AI安全相关的工作坊，他参与的研究项目曾在多个AI顶会和工作坊上发表，如CVPR、ECCV、ICML、ACM FAccT、NeurIPS等。黄民烈是清华大学教授，长期从事人工智能、深度学习和自然语言处理领域的研究工作，尤其专注于自然语言生成理论与模型、多模态基础模型、大语言模型的基础问题，以及情绪理解、心智建模等社会智能相关方向。徐葳是清华大学交叉信息科学研究院教授、副院长。

2025-05-27 13:29:42 588

转载四位图灵奖掌舵，2025智源大会揭示AI进化新路径

大会云集来自 MIT、斯坦福、清华、北大等 20 + 海内外顶尖科研院所的科学家们，他们将与DeepMind、Linux、华为、阿里、腾讯、百度等国内外AI领军企业的行业专家一道，共同探讨人工智能的前沿趋势与未来走向。与此同时，推理大模型的兴起、开源生态的加速、具身智能的百花齐放，成为2025年AI发展的关键词。当深度学习与强化学习交汇共振，当世界顶尖学者与产业领袖思想激荡，当前沿理论直面现实挑战——2025智源大会，将与全球AI同行共同把握技术跃迁的时代脉搏，洞见智能未来的无限可能。

2025-05-22 12:01:29 1062

转载青源会狮城再聚首，国际AI精英共探前沿发展

青源会是由AI领域有代表性的青年学者们自发成立的学术组织，于2020年6月正式创立，致力于为全球从事智能科学及相关领域的青年学者打造一个专注创新的交流与协作平台。秉持“发现关键问题、搭建合作网络”的使命，青源会始终聚焦青年学者的成长，经过五年发展，目前已拥有近200名正式会员和1700余名预备会员。与会嘉宾在轻松的氛围中相谈甚欢。新加坡资讯通信媒体发展局（IMDA）相关负责人在交流中提到，新加坡将全力支持AI领域的国际科研合作，并期待与青年学者们共同推动技术落地。随后的学者互动环节成为了整场活动的亮点，

2025-05-08 20:50:18 44

原创 2025智源大会InnoVibe学术新青年征集令，与AI前沿共振

2025智源大会将全新推出InnoVibe共创场，专为Z世代AI领域新青年搭建一个表达自我，碰撞思想的专属舞台。无论来自顶尖学府、科研机构，还是活跃在产业创新一线，只要您的思考能点燃AI发展的新可能，这里就是您的舞台。当人工智能的浪潮以前所未有的速度重塑世界，站在这场变革中心的AI新一代，将如何在这场浪潮发出自己的声音？，期待和在人工智能领域深耕的你，共赴一场无国界的思想派对！这不仅是演讲席位的争夺，更是青年创新社区的共建仪式！当你的脑洞打破AI世界的次元壁——当你的代码遇见千万同龄人的目光，

2025-05-08 20:50:18 250

原创图灵奖得主Joseph Sifakis：迈向工业化 AI——挑战与机遇

这样的自主系统应该是由智能体组成的分布式系统，每个智能体追求特定目标，智能体应该能够管理相互冲突的目标，与不可预测的网络物理环境互动，与人类协作。如果中国成功实现了这一愿景，中国将能够在工业 AI 领域取得领先地位，平衡 AI 的战略博弈，并与志同道合的国家联手，以一种调和科技发展与安全需求的方式规范AI，造福社会。如果中国成功实现了这一愿景，将能够在工业 AI 领域取得领先地位，平衡 AI 的战略博弈，并与志同道合的国家联手，以一种调和科技发展与安全需求的方式规范AI，造福社会。而像“自动驾驶系统”这。

2025-04-30 17:08:04 514

转载明日直播｜DeepSeek-通用领域奖励模型的推理时可扩展性研究

基于此，本文致力于突破现有奖励建模方法的局限，重点探索通用奖励模型在推理时扩展性（Inference-Time Scalability），即在推理时投入更多计算资源以带来更优奖励信号，从而进一步提升大语言模型在各类任务中的整体性能。本文提出了一种可有效提升通用奖励模型推理时扩展性的方法SPCT，并构建了通用奖励模型系列DeepSeek-GRM，其在多个基准测试中均超越现有主流奖励模型，性能在推理阶段表现出更强的可扩展性。其中，奖励建模作为强化学习的核心组件，旨在为模型提供准确的奖励信号。

2025-04-21 12:51:14 58

转载智源数据新基建系列 Workshop（第1期）来了！从大模型到具身智能

本期分享主题聚焦具身大脑大模型 RoboBrain 构建，跨本体具身大小脑协作框架 RoboOS 技术，语音技术未来十年走向分析，松灵机器人、睿尔曼智能技术分享、OpenSeek项目分享。欢迎扫码报名，相约北京智源人工智能研究院，与顶尖专家共同探讨从大模型到具身智能的数据新基建工作。4月24日（周四）14:00，智源数据新基建系列 Workshop（第1期）开启。

2025-04-21 12:51:14 66

原创报名丨第七届智源大会，6月6-7日北京见

而最根本的问题是：面对技术飞速演进，我们的安全法规与制度，准备好了吗？这场位于中国北京的“AI春晚”将延续以往的硬核学术基因，汇聚图灵奖得主、海内外顶尖机构学者与产业领袖，在思辨与实证的交织中，为 AI 的未来绘制导航图。面对这场认知与技术的双重跃迁，我们不禁要问：我们是否窥见了技术奇点的前夜。，第七届智源大会将以“线上+线下”联动的形式盛大开幕，落地北京。在这里，技术不是冷冰冰的代码，而是连接学术与产业、思辨与现实、现在与未来的桥梁。重磅学者，共同把舵，汇聚学术、产业与前沿创新的多元视角。

2025-04-17 12:01:33 1026

转载报名｜智源Workshop：欧洲“蓝脑计划”创始人Henry Markram、神经科学家Sean Hill讲座

通过实现数据集的共享和优化再利用，FAIR² 数据管理显著提高了研究效率和研究结果的可重复性，从而加速在全球卫生（global health）、地球可持续性（planetary sustainability）及科学创新领域的突破与进展。研究所设立了虚拟实验室（Virtual Labs），提供计算建模服务以及全面的数字化大脑模型资源库，从而使用户能够开展真实可靠的大脑模拟实验，验证科研假设，并深入探索神经回路的复杂性。推动开放协作，加速神经科学研究进程，并实现研究的普及化与大众化。

2025-04-09 16:05:44 126

原创七问具身智能：谁是下一代 AI 范式的关键变量 | 未来人工智能先锋论坛圆桌

因此，未来“大脑”和“小脑”都会发展，但关键在于如何高效融合团队，这既是技术问题，也是行业挑战。关于世界模型与具身智能，大家看法不一。具身智能作为AGI探索中的关键方向，逐渐显现出技术路线上的分歧与融合：有人强调其对动态感知与物理交互的依赖，有人提出“99%合成+1%真实”的训练策略，有人认为世界模型尚未触及本体物理，有人则支持其未来的预判能力。从数据和学习效率两个维度看，当前大模型主要依赖互联网上的文字和图像数据，但这远不能覆盖人类婴儿成长过程中所接触的真实、多模态感知信息，例如触觉、运动和环境互动等。

2025-04-03 14:20:24 624

转载活动报名｜LeCun学生分享，Transformer无需归一化也能高效稳定训练

然而，本文提出了一种新的方法，表明即使在不使用归一化层的情况下，Transformer 依然能够实现相同或更优的性能。DyT 在保持模型稳定性和加速收敛的同时，实验结果显示，采用 DyT 的 Transformer 在视觉识别、语言建模和自监督学习等多项任务中的表现与传统归一化方法相当，挑战了深度学习中“归一化层不可或缺”的固有观念。他的研究目标是通过创新的自监督学习方法和神经网络架构，推动人工智能在视觉理解的发展。他的研究兴趣主要包括视觉表示学习、视觉语言模型、自监督学习以及神经网络架构的优化。

2025-04-01 15:24:52 107

原创奇点降临，Manus 诞生背后丨青源Workshop观点集锦

如果 Agent 的功能被使用，它需要获得等价的报酬来维持自身在社会中的存在。如果 Agent 能发展到这个阶段，它的进化将不再需要人类通过算法驱动，而是像有生命体一样，能够自主生存并融入社会，甚至形成自己的社区。或许可以像林老师说的那样，构建一个更加贴近人类真实社会的体系，把虚拟的 token 转化成 Web 3 里面的 token，这可能是一个更好的选择。Agent 的理解存在差异，工业界多采用RAG加workflow的方式，而真正相对自由的 Agent 具有自主性，当前的 Agent 自主性较弱。

2025-04-01 15:24:52 867

原创 PyTorch Day 首次登陆 2025 智源大会！论文征集开启

展示等环节，主题涵盖 AI 应用和用例、核心 PyTorch 框架、深度学习编译器和核编写、边缘 AI 和设备端、AI伦理治理和监管、基于PyTorch 的生成式 AI 和大语言模型、开源协作、教育和社区建设、训练和推理优化、加速器硬件上的 PyTorch、PyTorch 生态系统和工具、PyTorch 在研究和学术界的应用、性能评估和基准测试、扩展训练和推理等方面。现诚挚邀请全球开发者与研究者，共同参与这场聚焦PyTorch生态的技术盛会，探索开源 AI 和机器学习的最新进展。PyTorch Day将。

2025-03-29 10:30:05 401

转载 95后博导张林峰专访：6年前提出自蒸馏算法，高效AI助推大模型时代丨独家

具体来说，以往的模型压缩工作主要关注减小模型的参数量，而我针对数据集压缩的工作则是关注在固定模型参数量的前提下，减少模型处理的数据量，降低token的规模。从这个角度来看，数据集压缩和我目前从事的模型压缩的最终目的是相同的，是降低AI模型计算成本的两个互补的角度。作为该领域的知名学者，张林峰的研究收到了越来越多的关注。在效率方面，模型整体的推理速度的提升还完全赶不上计算需求的增加，特别是随着Manus这种Agent系统的出现，模型解决问题的成本还会进一步爆发，针对这些新的问题，我们还要设计新的压缩方法。

2025-03-25 12:03:58 198

转载直播报名｜开启机器人操作新纪元，大规模高质量机器人学习数据集GO-1，AgiBot World

基于此，我们开发了Genie Operator-1（GO-1），一种新型通用操作策略模型，通过隐式动作表征最大化数据利用率，具有良好的可扩展性。为此，我们推出AgiBot World，这是全球首个大规模高质量机器人学习数据集，包含超过百万条原子动作轨迹，涵盖五大领域的100余种真实场景，涉及精细操作、工具使用和多机协作等复杂任务。此外，他是IEEE车载技术学会（Vehicular Technology Society）标准工作组主席，并担任IEEE高级会员（Senior Member）。

2025-03-24 16:39:29 89

原创迈向Super Agent，从Manus谈起

2023年起Agent框架开始收敛，多智能体系统（MAS）应用尝试加速，AI Agent领域迎来了飞速发展。但同时从Agent到Super Agent的推进仍面临诸多挑战：复现难度低、任务执行成本高、交付成果不理想等技术及应用中存在的问题仍需要进一步讨论，成为“得力助手”依然任重道远。3月20日（本周四）晚7点，智源社区组织「迈向Super Agent，从Manus谈起」线上workshop，邀请多位Agent专家与研究者，共同探讨Agent未来之路。时间：3月20日（本周四）晚7点（北京时间）

2025-03-18 18:19:14 395

原创迈向Super Agent，从Manus谈起丨研讨

2023年起Agent框架开始收敛，多智能体系统（MAS）应用尝试加速，AI Agent领域迎来了飞速发展。但同时从Agent到Super Agent的推进仍面临诸多挑战：复现难度低、任务执行成本高、交付成果不理想等技术及应用中存在的问题仍需要进一步讨论，成为“得力助手”依然任重道远。3月20日（本周四）晚7点，智源社区组织「迈向Super Agent，从Manus谈起」线上workshop，邀请多位Agent专家与研究者，共同探讨Agent未来之路。时间：3月20日（本周四）晚7点（北京时间）

2025-03-18 18:19:14 325

转载直播｜阿里通义千问Qwen2.5-VL解析，一作分享如何让大模型更好地看世界

Qwen2.5-VL是Qwen视觉语言系列的最新旗舰模型，包括从3B到72B的多个尺度的模型，以满足从边缘AI到高性能计算的各种应用场景。Qwen2.5-VL除了在基础的视觉识别出色、也具备更通用的目标定位能力、以及强大的文档解析和长视频理解方面能力，从而可以更好地理解世界并与世界互动。为了处理复杂输入，Qwen2.5-VL引入了动态分辨率处理和绝对时间编码，使其能够处理不同大小的图像和长达一小时的视频，并实现秒级事件的定位。负责打造QwenVL系列模型，不断推进多模态大模型更好地理解世界，保持开源开放。

2025-03-17 14:47:58 152

空空如也

空空如也