多项力压 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型
8 月 1 日消息,谷歌今晚宣布,Gemini 2.5 Deep Think 模型现已正式上线,现已在 Gemini 应用中向 Google AI Ultra 订阅用户开放。这款新模型在多个关键基准测试中超越了 OpenAI 的 o3 和 xAI 的 Grok 4。
据外媒 Neowin 报道,今年 5 月,谷歌在 Google I/O 大会上首次介绍了 Gemini 2.5 Pro 的 Deep Think 模式,采用全新研究方法,可在作答前综合多个假设进行推理。本次发布的是该功能的升级版,结合早期内测用户的反馈和最新研究成果进行了优化。谷歌表示,新版本在性能上相比最初的 I/O 版本有了显著提升。
谷歌还透露,这一模型是此前模型的一个变体(注:前述模型已在国际数学奥林匹克竞赛中获得金牌)。为适应日常使用场景,谷歌对其进行了加速优化,因此在 2025 年 IMO 基准测试中仅达到铜牌水平。
从基准测试结果可知,Gemini 2.5 Deep Think 在 LiveCodeBench V6、Humanity’s Last Exam、IMO 2025 和 AIME 2025 等项目中均表现优异。
目前,Google AI Ultra 用户每天可以在 Gemini 应用中以限定次数使用 Deep Think。当启用 Gemini 2.5 Pro 模型时,输入栏会显示“Deep Think”选项。谷歌指出,该功能将自动集成代码执行和谷歌搜索等工具。谷歌还计划在未来几周内,通过 Gemini API 向部分开发者提供带工具与不带工具的 Deep Think 模型版本。
声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。

游客
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。