刚刚,谷歌奥数金牌Gemini 2.5 Deep Think发布!多智能体推理碾压Grok 4、o3
创始人
2025-08-02 08:11:29

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:新智元)

「满血版」斩获IMO 2025金牌,谷歌最强Gemini 2.5 Deep Think正式上线!

只需每月支付250美元,即可通过Gemini Ultra订阅计划使用。

Gemini 2.5 Deep Think主打「多智能体推理」,可生成多个智能体并发进行推理。

虽然这一方法会消耗更多计算资源,但能极大提升AI推理的精准性。

1. 多智能体系统首次公开:Gemini 2.5 Deep Think是谷歌首个对公众开放的多智能体模型。其核心机制是并行生成多个智能体思考路径,从中筛选最优答案,尽管耗能更大,但推理效果显著提升。

2. 数学奥赛金牌验证:谷歌曾使用Deep Think变体参加2025年国际数学奥林匹克(IMO),并获得金牌。

3. 发布版达到铜牌级别:发布版本速度更快,日常使用更加便捷,同时在内部评估中基于2025年IMO基准测试仍能达到铜牌水平的表现。

4. 学术版模型首次释放:谷歌也将当时用于IMO的版本开放给少数数学家和学者测试,该模型推理过程耗时数小时,目标是提升研究能力与反馈机制。

5. 性能全面领先:

· 在Humanity’s Last Exam(HLE)中,Gemini 2.5 Deep Think取得34.8%的高分,领先xAI的Grok 4(25.4%)和OpenAI的o3(20.3%)。

· 在代码挑战LiveCodeBench6上,Gemini也以87.6%超越Grok 4(79%)与o3(72%)。

6. 工具整合与响应增强:Gemini 2.5 Deep Think可自动配合代码执行和谷歌搜索等工具,谷歌表示其能够生成比传统AI模型「更长的回复」。

Gemini 2.5 Deep Think模型特点:

· 支持输入类型:文本(如问题、提示、待总结的文档)、图像、音频、视频

· 上下文窗口长度:最大可接受100万(1M)tokens长度的上下文。

· 输出类型与长度:输出文本形式内容、最大输出长度可达192Ktokens

此前,为了争夺「首个」拿下IMO金牌的模型,OpenAI「不讲武德」,在没有经过组委会同意的情况下「抢先发布」消息。

这次在GPT-5发布前夕,谷歌率先Gemini 2.5 Deep Think。

你觉得谷歌Gemini 2.5 Deep Think能截胡GPT-5吗?

相关内容

热门资讯

艺... 在开始之前,我们先来说一下优秀的定义,就是能够得到你的模式的需求者(客户)的认可!那你会说这不简单啊...
99项冰雪赛事燃动呼伦贝尔 来源:内蒙古新闻网-《内蒙古日报本网呼伦贝尔12月26日电(草原云·内蒙古新闻网记者  梁亮)随着第...
明年1月1日起,公积金贷款利率... 转自:北京日报客户端根据2025年5月7日发布的《中国人民银行关于下调个人住房公积金贷款利率的通知》...
《做好源头守护人》第三季线下观... 中新网青海果洛12月27日电 (潘雨洁)26日晚,《做好源头守护人》第三季在青海省果洛藏族自治州玛沁...
唐山市公积金为何限制 2025... (来源:唐山劳动日报) 【问政内容】 唐山市公积金为何限制2025年之前京津购房者提取公积金? 【问...