谷歌发布Gemini 2.0 AI 大举押注人工智能代理
创始人
2025-02-06 09:16:21

谷歌周三向所有人发布了Gemini 2.0,这是该公司迄今为止“最强大”的人工智能模型套件。

去年12月,该公司向开发人员和值得信赖的测试人员提供了访问权限,并将一些功能打包到谷歌产品中,但据谷歌称,这是一个“通用版本”。

这套模型包括2.0 Flash,它被称为“主力模型,最适合大规模的高容量、高频率任务”;2.0 Pro Experimental,主要关注编码性能;2.0 Flash-Lite, 谷歌称其为“迄今最具成本效益的模式”。

Gemini Flash的文本、图像和视频输入每百万代币的成本为10美分,而其成本更低的版本Flash- lite的成本为0.75美分。

随着科技巨头和初创公司之间的人工智能军备竞赛白热化,这些持续发布的产品是大举投资“人工智能代理”的更广泛战略的一部分。

Meta、亚马逊、微软、OpenAI和Anthropic也在朝着人工智能的方向发展,即能够代表用户完成复杂的多步骤任务的模型,而不是让用户亲自完成每一步。

谷歌在去年12月的一篇博客文章中写道:“在过去的一年里,我们一直在投资开发更多的代理模型,这意味着它们可以更多地了解你周围的世界,提前考虑多个步骤,并在你的监督下代表你采取行动。”谷歌补充说,Gemini 2.0“在多模态方面取得了新的进展,比如原生图像和音频输出。以及本地工具的使用”,并且模型家族“将使我们能够构建新的人工智能代理,使我们更接近我们对通用助手的愿景。”

Anthropic是亚马逊支持的人工智能初创公司,由OpenAI前研究高管创立,是开发人工智能代理的主要竞争对手。去年10月,这家初创公司表示,它的人工智能代理能够像人类一样使用计算机完成复杂的任务。这家初创公司表示,Anthropic的电脑使用能力使其技术能够解读电脑屏幕上的内容,选择按钮,输入文本,浏览网站,并通过任何软件和实时互联网浏览执行任务。

Anthropic的首席科学官贾里德·卡普兰(Jared Kaplan)当时在接受采访时表示,该工具“基本上可以像我们一样使用计算机”。他说,它可以完成“几十甚至几百步”的任务。

OpenAI最近发布了一个类似的工具,引入了一个名为Operator的功能,可以自动执行计划假期、填写表格、预订餐厅和订购杂货等任务。这家微软支持的初创公司将Operator描述为“一个可以上网为你执行任务的代理”。

本周早些时候,OpenAI宣布了另一个名为“深度研究”的工具,该工具允许人工智能代理编写复杂的研究报告,并分析用户选择的问题和主题。谷歌在12月推出了一个类似的同名工具——深度研究——它的作用是“研究助理,探索复杂的主题,并代表你编写报告。”

去年12月,谷歌将在2025年初推出几项人工智能功能。

“在历史上,你不需要总是第一,但你必须执行得很好,成为同类产品中最好的,”首席执行官桑达尔·皮查伊当时在一次战略会议上说。“我认为这就是2025年的意义所在。”

相关内容

热门资讯

数说“新”变化丨生态优先、绿色... 本文转自【天山网】; 据统计,新疆森林面积达1.25亿亩,森林覆盖率为5.07%。面对这笔宝贵的绿色...
科创001|财报数据创新高,小... 深圳商报·读创客户端首席记者 陈小慧 3月24日,小米发布了2025年Q4及全年财报。财报数据显示,...
“锅底洼”如何长成“梦里水乡”... 在江苏省泰州市兴化市,有这么一座乡村,它静卧在里下河湿地腹地,坐拥独有的垛田地貌,河网交织、湖荡密布...
​左海会客厅丨“星妈”张秀丽:...   左海会客厅丨近日,“星妈”张秀丽获评2025年“感动福建”十大人物。她为一群“星星”点亮了前行的...
“速效救心丸”搜索量激增30倍... 3月25日 有电商买药平台数据显示 速效救心丸、硝酸甘油、 硝酸甘油舌下片等心脏用药品类 相...