谷歌推出实验性AI推理大模型
创始人
2025-02-06 06:52:45

作者 | Daniel Dominguez

译者 | 明知山

策划 | Tina

谷歌推出 Gemini 2.0 Flash Thinking Experimental,一个在其 AI Studio 平台上可用的 AI 推理模型。这个实验性模型旨在通过推理复杂问题并解释其思考过程处理多模态任务,如编程、数学和物理问题。它基于 Gemini 2.0 Flash 模型,并与类似的模型(包括 OpenAI 的 o1)保持同步。

该模型采用结构化方法,将提示词分解为更小的任务,分析相关上下文,整合出最准确的回答。尽管如此,其推理过程可能并不稳定,例如在执行简单任务(如计算单词中的字母个数)时会出错。它支持最多 32000 个 Token 输入,包含文本和图像输入,并以纯文本格式输出最多 8000 个 Token。由于增加了额外的推理时间,模型的响应速度较慢,从几秒到几分钟不等。它缺少内置的搜索、代码执行或 JSON 模式等工具,回答的准确性和完整性也可能参差不齐。Gemini 2.0 Flash Thinking Experimental 需要更长的处理时间,这是与其推理能力做出的权衡。

谷歌 DeepMind 首席科学家 Jeff Dean 表示:

该模型在推理过程中利用了扩展的计算能力,以改善推理结果。

AI Studio 产品负责人 Logan Kilpatrick 将此次发布描述为:

谷歌在探索以推理为中心的 AI 方面做出的初步尝试。

此次发布紧随 AI 推理模型的最新发展趋势,竞争对手如 DeepSeek-R1 和 阿里巴巴的千问 也纷纷布局该领域。这些模型旨在提高生成式 AI 系统的准确性和可靠性,但同时也带来了高昂的计算成本和性能挑战,尤其是在传统的 AI 扩展方法已显示出收益递减的情况下。

开发人员可以通过 Gemini API (v1alpha) 或 Google GenAI SDK 访问该模型,支持文本和图像输入,并专注于透明推理工作流的集成。作为一款研究型产品,该模型存在一些限制,例如 Token 数量有限且缺少内置工具集成。

查看英文原文:

https://www.infoq.com/news/2025/01/google-deepmind-gemini/

相关内容

热门资讯

最新或2023(历届)乌鲁木齐... 十大暴利行业TOP1:房地产  从来没有哪一个行业像房地产业这样盛产亿万富翁,各种富豪排行榜上,房地...
最新或2023(历届)北京推进...  五年来,围绕努力实现城乡劳动者充分就业的目标,全市就业规模不断扩大,城镇新增就业214.7万人,就...
最新或2023(历届)北京市机... 关于印发《北京市机关事业单位工作人员养老保险制度改革实施办法》的通知京政发[最新或2023(历届)]...
“浙BA”新年首战,台州队终结... (来源:财闻) 台州队下一场比赛将在1月10日19:30客场对阵金华队,杭...
突发!“沙特发动空袭” 也门南方过渡委员会消息人士2日告诉记者,该委员会在哈德拉毛地区的目标遭沙特空袭。也门政府对南方过渡委...