谷歌对OpenAI见招拆招
创始人
2025-11-22 01:16:27

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:虎嗅APP)

出品|虎嗅科技组

作者|余杨

编辑|苗正卿

头图|视觉中国

11月19日消息,谷歌家旗舰版Gemini 3 Pro model上线,官宣其编码和推理能力都有所提升,而“谄媚”变少。

不难发现,谷歌瞄准了它的对手ChatGPT。这款号称谷歌迄今为止“最智能”、“最准确”的模型首次向所有用户开放,并且发布首日即可体验。

谷歌DeepMind高级总监兼产品负责人Tulsee Doshi表示,随着谷歌搜索引擎的不断发展,这款新模型将助力谷歌实现“人人皆可获取且人人皆可使用”的信息目标。

“我认为朝着这个方向迈出的一大步,就是跳出仅仅提供文字回复的模式,让你看到更丰富、更完整的实际内容。”

简单来说,Gemini 3 Pro 具有“原生多模态”特性,它可以同时处理文本、图像和音频,传统的文本-文本的单一交互状态得到了提升,编码功能的增强也使其能够生成更好的视觉效果。在谷歌的官方演示中,AI 对RNA进行了加工处理,整体表现得很流畅。

谷歌官方表示,Gemini 3 Pro 还可以翻译菜谱照片,然后将其转换成食谱;除此之外,它还可以根据一系列视频讲座创建交互式学习卡片。

在 Gemini 应用中,用户则可以在内置的 Canvas 中构建功能更全面的程序。升级后的 AI 模型支持“生成式界面”,一方面可以创建类似杂志的视觉格式,其中包含可供浏览的图片,另一方面可以根据用户的提示创建定制的自定义用户界面的动态布局。这款工具目前还在测试中。

在搜索功能上,Gemini 3 Pro可以根据用户的搜索呈现图像、表格、网格和模拟等视觉元素。根据 Google 的公告,这项技术现在不仅能将问题分解成可搜索的部分,还能更好地理解用户的搜索意图,从而“找到之前可能遗漏的新内容”。

谷歌对OpenAI见招拆招,几乎毫不掩饰地暗讽,称Gemini 3 Pro不像ChatGPT那样充斥着空洞的奉承。

Doshi表示,Gemini 3 Pro的回复会有“显著”的变化,谷歌将其描述为“智能、简洁、直接,摒弃陈词滥调和奉承,提供真正的洞见——告诉你你需要听到的,而不仅仅是你想听到的”。

除了这些改进之外,Gemini 3 Pro 还具备更强大的推理和智能代理能力,使其能够完成更复杂的任务,并“可靠地进行长期规划”。谷歌表示,该模型为 Gemini Agent 的一项实验性功能提供支持,该功能可以在 Gemini 应用内帮用户执行任务,例如查看和整理电子邮件,或搜索和预订旅行。

也就是说,谷歌此番发行的不仅仅是模型单品,还是一个充满策略的“聪明桶”——覆盖了AIGC、AI应用、AI搜索和AI Agent全范围。

而在官方的跑分21项基准测试中,Gemini 3 Pro 除了OCR和代理编码表现相对较弱,其他指标几乎都遥遥领先,有相当的优势。

不仅如此,而谷歌又单独拎出了人类最终测试、终端工作台2.0和SimpleQA Verified三个指标加以强调,矛头直指Claude Sonnet4.5和GPT-5.1。

谷歌试图表达,Gemini 3 Pro 在标准化知识生成、AI工具使用乃至“人工智能”这几个重要指标方面,具有全方位的优势。

在发布Gemini 3 Pro的同时,谷歌还推出了 Antigravity,这是一款基于 Gemini 3 Pro 以及其他第三方模型的开发工具。谷歌表示,Antigravity 支持多个智能体,并允许它们直接访问编辑器、终端和浏览器,其设计理念是面向“智能体优先的未来”。

Antigravity 有两个关键组件。

其中之一在于它如何报告自身的工作。具体来说,在完成任务的过程中,它会生成 Google 称之为“工件”的文件:任务列表、计划、屏幕截图和浏览器录制,旨在验证它已完成的工作以及即将执行的工作。

不仅如此,Antigravity 还会报告其操作和外部工具的使用情况,但 Google 表示,相比模型操作和工具调用的完整列表,“工件”更便于用户验证。

另一项重大改进是提供了两种主要使用视图。默认的编辑器视图提供熟悉的集成开发环境 (IDE) 体验,类似于 Cursor 和 GitHub Copilot 等竞争对手,并在侧边栏中显示代理。而全新的管理器视图则旨在同时控制多个代理,使每个代理都能更加自主地工作。

谷歌将其比作“任务控制中心”,用于“并行地在多个工作区中生成、协调和观察多个代理”。

谷歌推出了更多向人工智能代理提供反馈的方式,用户可以在代理执行特定任务时留下评论,供其参考,而无需中断其工作。谷歌表示,Antigravity 中的代理能够“从过去的工作中学习”,保留特定的代码片段或执行特定任务所需的步骤。

在官方演示中,Antigravity 构建了一个基本的航班跟踪应用程序,对其进行了测试,并通过浏览器录制报告了该测试结果。

目前,Antigravity 已推出公开预览版,兼容 Windows、macOS 和 Linux 系统。

谷歌此次的出击,并不止于发布一个大模型这么简单。智能体开发平台的开放性,展露出谷歌构建从模型、应用到开发者的完整生态闭环的野心。

多模态的交互将AI从一位博学的“对话者”,重塑为一个能看、能听、能行动、能规划的“执行者”。当AI 开始理解和操作多媒体世界,未来3D和全景、沉浸式的交互竞赛,也就不远了。

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。如对本稿件有异议或投诉,请联系 tougao@huxiu.com。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4808031.html?f=wyxwapp

相关内容

热门资讯

最新或2023(历届)想象未来... 作文一:未来的想象我相信你们儿时都有想象过未来是什么样子的,今天,我也带你们畅想一回我想象的未来。大...
八国首饰展登陆濮院,国际首饰双... (来源:上观新闻)今天,浙江濮院时尚古镇迎来首届“濮院国际当代首饰艺术与设计双年展”,以“微应变”为...
最新或2023(历届)喜欢的游... 作文一:我最喜欢的游戏我最喜欢的游戏是“三个字”。你肯定还不知道这个游戏怎么玩吧?现在我就给你一一介...
最新或2023(历届)五年级优... 作文一:美丽的太湖今天是“五一长假”爸爸带我去太湖玩。我早就听说“太湖美,美就美在那水”,今天能来太...
最新或2023(历届)五年级想... 作文一:叶子们的聚会秋风轻轻的吹来,叶子们也踏着秋风来参加最后一次聚会。第一位嘉宾是枫叶,它是派对里...