Skip to main content

Gemini Deep Research

Save hours of work with Deep Research as your personal research assistant, now with Audio Overviews

Deep Research 是什么

借助 Gemini 中的 Deep Research,快速了解各种领域的内容。这一智能体功能可替你自动浏览多达数百个网站、分析搜寻到的结果并生成内容丰富的多页报告,还能将这些报告转换为生动有趣的播客式对话。

规划

Deep Research 能够根据你的需求,将简单的提示转化为专属的多维度研究计划

搜索

Deep Research 能够自主完成网络搜索和深度资料挖掘,为你找到最相关、最新的信息

推理

Deep Research 会不断根据收集到的信息进行推理,思考后才进行下一步,并将整个思路呈现在你眼前

报告

Deep Research 可在几分钟内为你生成内容丰富、高度定制的研究报告,其中包含深入的细节和独到的见解,还能转换为音频概览,替你节省数小时的宝贵时间

如何使用 Deep Research

如果你有复杂的调研任务,不妨交给 Gemini Deep Research。它可以将任务分解,在网络上搜寻答案,并将发现结果综合整理成全面的研究报告。

With, Gemini is even better at all stages of research, from planning to delivering even more insightful and detailed reports. Now, you can also turn your report into an Audio Overview so you can stay informed even when you’re multitasking.

竞争分析

了解新产品所面临的竞争格局,包括竞争对手的产品特点、定价策略、市场推广方式和客户反馈信息。

尽职调查

调查潜在客户,分析目标公司的产品组合、过往融资情况、团队实力以及竞争态势。

主题理解

通过辨析关键概念的异同,梳理想法之间的关联,并阐释背后的根本原理,实现对主题的透彻理解。

产品比较

综合考量产品的功能特点、性能表现、售价以及客户评价,对不同型号的电器进行评估。

Deep Research 的推出,标志着我们在迈向更加智能的代理式 AI 的道路上迈出了重要一步。它正逐渐从简单的问答工具,蜕变为能够进行复杂思考与任务执行的真正协作伙伴。

立即免费试用吧

了解实际应用

跟着 Deep Research 资深产品经理 Aarush Selvan 一起认识这项新功能。

如何访问 Deep Research

立即免费试用 Deep Research

  • 在桌面设备上

  • 在移动设备上

  • 适用于 150 个国家/地区

  • 支持超过 45 种语言

  • 已向 Google Workspace 用户开放

只需从提示栏或模型选择器下拉菜单中选择 Deep Research,即可开始使用,让 Gemini 替你开展研究工作。

Gemini Advanced subscribers can use Deep Research with Gemini 2.5 Pro (experimental), our most intelligent AI model.

第一版 Deep Research 的诞生

2024 年 12 月我们在 Gemini 体系中首度推出 Deep Research 这项产品类别,并于隔天邀请了部分团队成员聊聊这款产品。

代理式系统

为了构建 Deep Research 功能,我们开发了一种新的规划系统,让 Gemini 应用学会处理复杂问题。针对 Deep Research,我们训练了 Gemini 模型的以下能力:

  • 拆解问题:收到复杂的用户问题后,系统首先会制定一个详细的研究计划,将问题拆分为一系列更小、更容易处理的子任务。掌控权仍在用户手中:你可以修改 Gemini 制定的计划,确保研究方向正确。

  • 研究:模型开始监督该计划的执行,并会根据子任务的性质,灵活决定哪些工作可以同时处理,哪些工作需要依序完成。模型可以使用搜索和网络浏览等工具来获取信息并进行推理。在每个步骤中,模型都会根据可用信息进行推理,以决定下一步该怎么执行。我们特别为这项功能新增了一个思考面板,方便用户及时了解模型目前学到的内容,以及预计执行的下一步操作。

  • 合成:模型确定已经收集到足够的信息后,就会将手上的结果综合成一份详尽的报告。在生成报告的过程中,Gemini 会批判性地评估信息,识别关键主题和不一致之处,并生成一份逻辑清晰且信息丰富的报告,甚至通过多次自我审查来提升报告的清晰度和细节。

新类别,新问题,新解决方案

我们在构建 Deep Research 时必须克服三个重大技术难题:

多步骤规划

研究任务需要分多个步骤反复规划。模型会在每个步骤中,参考目前收集到的所有信息,找出缺漏和不一致之处,并继续探究,同时还要在报告的全面性与计算资源、用户等待时间之间进行权衡。我们以数据高效的方式训练模型,使其能够有效完成长时间的多步骤规划,从而让 Deep Research 可以利用公开资料处理各种类型的研究主题。

耗时较长的推理

典型的 Deep Research 任务可能需要在几分钟内调用多个模型。这无疑给智能体的构建带来了挑战:开发者务必确保单点故障不会导致任务必须从头开始执行。

为了攻克这个问题,我们开发了一种新颖的异步任务管理器,确保负责规划和执行任务的模型保持状态一致,不必重启整个任务也能从容地完成错误恢复。该系统可以做到真正的非同步:在启动 Deep Research 项目后,你可以切换到其他应用,甚至直接关闭电脑;下次打开 Gemini 时,如果研究已完成,系统会发出提醒。

上下文管理

在一次研究过程中,Gemini 就可能会处理数百页的内容。为了保持连贯性并支持后续提问,我们利用了 Gemini 业界领先的 100 万个 token 上下文窗口,同时辅以 RAG 设置作为补充。因此,系统能有效地“记住”在对话期间学到的所有内容,随着互动次数的提升,它会变得越来越聪明。

Evolving with new models

Deep Research 于 12 月推出时,是由 Gemini 1.5 Pro 驱动的。而随着 Gemini 2.0 Flash Thinking(实验版)的推出,我们得以显著提升该产品的质量和服务效率。在引入推理模型后,Gemini 在执行每个后续步骤前,都会投入更多时间精心规划方法。这种自我反思和规划的固有特性,使其非常适合这类长时间运行的智能体任务。我们发现,现在 Gemini 在研究的各个环节都实现了全面提升,并且能够生成更为详尽的报告。同时,因为 Flash 模型的计算效率更高,我们能够将 Deep Research 推广给更多用户。Flash 和推理模型的开发让我们倍感振奋,期待 Deep Research 功能变得越来越好。

And with our most capable model, Gemini 2.5 Pro (experimental) in Gemini Advanced, Deep Research is even better at all stages of research, delivering even more insightful and detailed reports

后续发展

我们希望构建一个多功能系统,因此后续,我们将让用户可以进一步掌控模型能浏览哪些内容,并让模型能够使用开放网络之外的多样化来源,持续拓展系统的功能边界,为你提供更丰富的体验。

我们期待见证大家运用 Deep Research 的各种方式,这些实际使用经验将为我们持续构建和改进 Deep Research 提供宝贵的参考价值。最终,我们的目标是打造一个真正具有代理能力、能为所有人提供帮助的 AI 助理。

智能体 Gemini

推理
搜索
浏览

Gemini 的新型代理式 AI 系统汇聚了 Gemini、Google 搜索和网络技术的优势,能够以持续推理循环的方式,不断地搜索、浏览和仔细分析信息,从而获得更详尽的结果。