IT资讯 Gemini 2.5 Flash-Lite 稳定版(GA)发布

rolland · 2025-07-23 14:30:08 · 热度: 36

谷歌宣布其速度最快、成本最低的 Gemini 2.5 Flash-Lite 模型已正式进入稳定状态(GA)。

Gemini 2.5 Flash-Lite 在性能和成本之间取得了平衡,原生支持 100 万 token 上下文等高级功能。该模型定价为每百万输入 token 0.10 美元,每百万输出 token 0.40 美元,与 GPT-4.1 Nano 的价格相当。与预览版相比,其音频输入定价降低了 40%。

Gemini 2.5 Flash-Lite 稳定版(GA)发布

Gemini 2.5 Flash-Lite 在编码、数学、推理和多模态理解等多个基准上表现优于 2.0 Flash-Lite,支持 100 万 token 的上下文窗口、可控的思考预算(thinking budgets),以及 Grounding with Google Search、代码执行和 URL 上下文等原生工具。

开发者现在可以通过在代码中指定 gemini-2.5-flash-lite 来使用该稳定版模型。原有的预览版别名计划于 8 月 25 日移除。

猜你喜欢:
暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册