昨天,DeepSeek R1 模型完成最新升级并全面开源。不久后,独立评测机构 Artificial Analysis 发布最新排名:DeepSeek 凭借 R1-0528 版本跃居全球第二大 AI 实验室 ,与谷歌 Gemini 2.5 Pro 平起平坐,一举超越马斯克的 xAI、扎克伯格的 Meta 和 Anthropic 三大硅谷巨头。
DeepSeek-R1 在七项顶级测试中综合得分从 60 分飙升至 68 分,进步幅度与 OpenAI 从 o1 到 o3 的代际升级相同。
尤其引人瞩目的是,它在竞赛数学(AIME 2024)和代码生成(LiveCodeBench)能力方面,表现仅次于 OpenAI o4-mini 高配版,位列全球第二。
另一方面,开源生态正在改写游戏规则。在 Artificial Analysis 的榜单中,代表开源模型的蓝色矩形首次力压一众闭源黑箱,DeepSeek-R1 以 68 分高居开源阵营之首,阿里通义千问 Qwen3-235B 以 62 分紧随其后。
现在,DeepSeek 作为开源之王,正以中国力量撼动全球 AI 格局。
然而,DeepSeek 此次突破并没有依赖参数膨胀。R1-0528 沿用的依旧是原有架构(6710亿总参数/370亿激活参数),团队通过强化学习优化实现了智能跃迁。
同时,团队还将 DeepSeek-R1-0528 的思路提炼到训练后的 Qwen3 8B Base 模型中,得到了 DeepSeek-R1-0528-Qwen3-8B。这款同步开源的精简版模型,用 80 亿参数在 AIME 2024 数学测试中逼平阿里千问 2350 亿模型。
这种思路对于推理模型的学术研究和专注于小规模模型的产业发展都具有重要意义。
中国 AI 的破局之道
在最新发布的斯坦福 AI 指数报告中,中国 AI 模型对全球开源生态的贡献度首次突破 40%。DeepSeek 与阿里巴巴通义千问成为两大支柱,前者以技术深度见长,后者以模型数量取胜。
报告特别指出,中美 AI 的性能差距已从 2023 年的 17.5% 骤降至 0.3%,同时,在2024年重要大模型评选中,阿里巴巴共有 6 个入选,贡献度排名第三。
在这场全球 AI 竞技场中,中国团队正在将开源模型的智能推至闭源护城河畔,通过开源共享加速技术普惠,用创新突破算力封锁。
正如 DeepSeek 创始人所言:“AI 的未来属于开放协作,当技术壁垒被打破,人类触及 AGI 的速度将超越所有想象。”