OpenAI重磅更新：发布目前最强推理模型ChatGPT-o1，新鲜测试出炉，草莓快要成熟了

机械心

已于 2024-09-13 14:42:56 修改

阅读量6.1k

点赞数 28

CC 4.0 BY-SA版权

分类专栏：人工智能文章标签： chatgpt 人工智能

于 2024-09-13 14:39:20 首次发布

本文链接：https://blog.csdn.net/a8598671/article/details/142205761

1. ChatGPT-o1背景

北京时间2024年9月13日凌晨一点，OpenAI 突然发布了重大更新，正式推出了备受期待的 o1 系列模型。这次更新标志着 OpenAI 在人工智能推理能力上的重大突破，推出了其最新的大语言模型——o1-preview 和 o1-mini。这一更新揭开了已经预热接近一年的 “Q*/草莓项目” 的神秘面纱。“草莓”项目（Strawberry）是 OpenAI 推出的一个秘密项目，旨在提升 AI 模型的推理能力，以接近通用人工智能（AGI）的第二级别——推理者级别。这一项目的核心在于通过优化模型的逻辑推理和自我训练算法，从而突破传统 AI 的性能瓶颈。

具体而言，“草莓”项目包括了一种特殊的“后训练”方法，通过这种方法，AI 模型能够在完成大规模数据集上的预训练之后，进一步优化其在特定任务上的表现。这种方法类似于斯坦福大学在2022年开发的“自学推理者”（Self-Taught Reasoner，简称STaR）方法，旨在通过反复创建自己的训练数据，让 AI 模型“自行引导”进入更高的智能水平。