本文来自微信公众号:,编译:林易,原文标题:《谢尔盖·布林首次复盘:谷歌AI为什么落后,又如何实现绝地反击》,头图来自:视觉中国
“谷歌AI落后了”。这是ChatGPT诞生以来,很长一段时间内,科技行业的主流声音。
过去三年,全球科技圈的主流叙事中有且仅有两个主角:英伟达负责卖铲子,提供GPU硬件基础;OpenAI负责挖金矿,凭借Scaling Law定义前沿模型。
谷歌则长期被认为是在AI竞赛中落后的巨头,模型不如OpenAI,甚至连搜索业务也面临被取代的风险。直到谷歌创始人谢尔盖·布林(Sergey Brin)回归一线,亲自管理AI业务,并先后Gemini 2.5和Gemini 3系列大模型后,一切才彻底发生了改变。
上个月,谷歌推出最新的Gemini 3系列模型和第七代TPU Ironwood,彻底改变了AI行业的游戏规则。现在,轮到OpenAI拉响红色警报了。
12月13日,谢尔盖·布林现身母校斯坦福大学工程学院的百年校庆活动。面对台下数百名年轻的工科生,布林首次坦诚谷歌在AI浪潮初期的战略误判,并深入剖析了这场绝地反击背后的布局。
当被问及谷歌在AI早期的被动局面时,谢尔盖·布林说,尽管谷歌早在八年前就发布了Transformer论文,但公司内部却并未给予足够的战略重视。
“我们当时在算力扩展上的投入过于保守,甚至可以说是有些胆怯。胆怯源于谷歌作为搜索巨头的包袱。”由于担心聊天机器人可能会输出错误信息或不当言论,谷歌在产品化路径上迟疑不决。这种犹豫给了OpenAI绝佳的空窗期,OpenAI敏锐地抓住了机会,通过ChatGPT一举占据市场前沿。
谢尔盖·布林重返一线很大一部分原因是去救火。回到谷歌后,布林并没有选择坐在高层会议室里听取汇报,而是直接投身于Gemini模型的研发中。他透露,自己现在每天上下班的路上都在与内部版本的Gemini进行语音对话,测试其极限。
“你们现在公开版用到的模型版本其实相当古老,我自己在车里用的那个版本要强得多,大概几周后我们就会把它推向市场。”
这某种程度上印证了外界对于Gemini 3迭代速度的猜测,谷歌正在快速将实验室里的前沿成果转化为产品。
谷歌基于深厚的底层技术积累实现绝地反击。在芯片层,第七代TPU Ironwood为Gemini3系列模型的性能释放提供了硬件支撑,在性能、能效比和互联带宽上,均显示出对GPU的显著优势。
在模型层,Gemini 3系列原生多模态能力和超长上下文窗口,将行业标准提升到了一个新的量级。不同于竞争对手将多模态能力进行接口缝合的做法,Gemini 3从基础架构层面就支持文本、代码、图像、音频和视频的统一理解和生成,展现了更高层级的通用智能。
在应用层,谷歌模型能力深度融入其核心应用生态。在Workspace生产力套件中,Gemini被嵌入到用户的日常工作流。在核心搜索产品中,传统链接列表转变为由Gemini驱动的摘要性、多模态答案。此外,结合Veo等视频生成应用,谷歌在内容生成领域也展示了模型能力的商业化落地,实现了从模型突破到应用生态的全家桶式体验升级。
尽管谷歌错过了Transformer技术商业化的最佳窗口,但其深度学习和算法的原创积累仍在。谷歌的人才库和基础研究功底,使他们能够迅速调整策略,将研究成果直接转化为下一代架构的优势。这种全链条自主可控能力,为谷歌提供了可观的模型迭代效果,使其能够迅速缩小差距并实现超越。
在谈及行业目前普遍迷信的Scaling Law(扩展定律,即单纯通过堆砌算力和数据来提升模型性能)时,谢尔盖·布林给出了一个反直觉的判断:虽然外界的目光都聚焦在庞大的数据中心和GPU集群上,但真正的决胜点可能在于算法效率。
“如果仔细梳理过去十年的发展,你会发现算法层面的进步速度其实是跑赢了单纯的算力扩张速度。”这也解释了为何谷歌在Gemini 3的研发中,不再单纯追求参数量的盲目膨胀,而是转向了更高效的MoE(混合专家)架构和长上下文处理能力。
谢尔盖·布林还提到,谷歌从未停止在算力基础设施上的投入,TPU项目早在12年前就已启动,软硬一体的长期积累,是谷歌能够在算力紧缺的当下,依然保持快速迭代的护城河所在。
面对学生关于AI未来的提问,他表示,目前尚不清楚智能是否存在天花板,AI是否能做到人类无法做到的事情。AI不仅是代码生成的工具,更是人类能力的倍增器。建议年轻一代不必过分焦虑于AI对职业的替代,而是应该学会利用AI来提升创造力。
以下是谢尔盖·布林访谈实录:
一、布林在斯坦福的教育背景
主持人:欢迎大家。这是我们百年纪念年的闭幕活动,我是Jennifer Widom,第十任工程学院院长。
我想铺垫一下背景。在90年代早期,Sergey Brin作为计算机科学博士研究生来到斯坦福。电子邮件正开始成为许多人交流的方式。创业才刚开始加速。工程学院第六任院长Jim Gibbons孕育了斯坦福科技创业项目(Stanford Technology Ventures program)的想法,这也是今天这个课程的主办方。我于 1993 年以助理教授身份加入,与Sergey是同一年到达的。当时斯坦福还有一位本科生在同一时间开始他的大四,那就是John Levin。
John曾在这里攻读数学和英语的本科学位。他去麻省理工学院(MIT)攻读博士学位,并于 2000 年回到该校任教。他曾任经济学系主任、商学院院长,并于2024年8月成为斯坦福大学第13任校长。因此,我现在很高兴请斯坦福校长John Levin以及Sergey Brin上台,加入我们的对话。
Sergey Brin:好啦,你们夸我太过头了。我想其中有很大程度是运气成分,不过无论如何,感谢你们邀请我。很高兴能来到这里。
John Levin:那我们回到那段时间吧,带我们回到你在斯坦福读研的时候。跟我们说说那时在工程学院就读的情况,以及它如何塑造了你,并为创建Google打开了机会。
Sergey Brin:回想起来,也许当时我并没有意识到它的价值,但那是一个非常有创造力且自由的时期。我想我们在这里进行了工作。Google背后已经有好几年了,大概从 95 年开始。并且要为Larry点赞,他真的很专注于网页的链接结构。
但在那时,网络是新事物,想出一些新点子是如此容易。比如我想我的第一个赚钱点子是点披萨。那时候看起来简直不可思议,你居然可以在线点外卖。如今我们把它视为理所当然。我喜欢把一则可乐广告放在顶部。我以为那很有趣,会有网络广告。
总之,这个计划彻底失败了,因为它的工作方式是你要先下单到网站。总的来说,披萨店通常不在线,但我想到它们有传真机,所以它会自动把订单通过传真发给他们。但后来我意识到他们实际上并不经常查看传真,然后就从那时候开始失败了。
但当时,我想我们大概都是这样吧,在计算机科学系,相当理解互联网的工作原理,所以大家就在网上画各种东西。那真是一个非常有创造力的时期。
无论如何,Larry 当时专注于链接结构。那时我在做数据挖掘,于是我们联手了。很快我们就发现我们有了一些对搜索非常有用的东西。但我们花了一段时间只是在斯坦福对它进行实验,以及是否考虑做一个学术项目。我们尝试去把它授权给各种互联网公司。
有一次我们把它推介给了Excite,Excite并不太感兴趣。但Vinod觉得这个主意很棒。我们和Vinod通过邮件来回沟通,然后我们发了个通知,说我们会给你们授权这项技术,以160万美元的价格。大约15分钟后我们收到了回复,我们都很兴奋,对研究生来说,那是一大笔钱。
John Levin:所以从那个起点出发,你现在回头看,Google现在是一家市值4万亿美元的公司,并且您每分钟处理1000万次搜索,而且涉及各种不同产品的庞大数量。在一开始你做的事情中有没有哪些是做对了的,你回头看有什么想法,而且你认为这是非常重要的事情?
Sergey Brin:我认为在早期,Larry一直都非常有雄心。我们确实在相当早的时候有非常雄心勃勃的使命宣言,要组织全世界的信息等等。我觉得那是一种很好的方式,以某种哲学为出发点创办一家公司。还有,我们确实开始了一项相当学术性的研究,志同道合的公司。
我们俩都是博士项目出来的,像当时很多初创公司一样,我们差不多已经大学毕业了。我只是觉得那在某种程度上会改变你看待事情的方式,有一点点。而且有许多杰出的公司,明确地说,它们都是从大学中走出来的。但对这种基础研发方面的投资,我确实认为这是文化的一部分,而且很早就存在。
John Levin:你们还雇了很多博士,所以并不只有你们两个。
Sergey Brin:是的,非常多。我记得Urs Hölzle,他是我们最早的一批人之一。我认识他是因为我在斯坦福的教授聘任委员会。他一给我发便条的那一刻,我就想着,你能在明天开始吗?我的意思是,因为我已经认识他了,以及他所有的资历。
二、谷歌的创新哲学与AI反击
John Levin:我是说,我认为这是一个有力的论点,谷歌是过去25年里全球最具创新性的公司。大型公司确实非常难以做到这一点,保持高度创新。每个人都为此苦苦挣扎,而你们已经做到了。很多人会把那里的重大影响归功于你个人,对那里产生了重大影响。你如何看待培养一种文化,在创新中你的角色是什么?
Sergey Brin:我想,首先,我们确实在很多事情上失败过。我们现在不需要把所有事情都一一列举,但是我们同时也经历了很多失败。所以,部分原因就是在不断尝试。我认为这与其某种学术背景有关,也许我们更倾向于尝试困难的事情。
我想这有点像是进入过去十年左右的阶段,尤其是那些困难的事情变得越来越有价值。如果你看人工智能,这显然是一个巨大的趋势,但是就是那种计算量,深入探讨这一点,必须投入的那种深层数学的量,那些都是从技术上来说是深奥且具有挑战性的问题。
有一段时间,你什么东西都可以放到.com上。它并不是真的那么技术深入,只是对网络的粗浅理解。幸运的是我们当时在做搜索,这确实需要一些更深的技术技能,但技术复杂度水平只会越来越高。
事实上,我们现在招聘的员工,要么比我更有资质,要么至少比我当时更有资质。我的专业是偏数学的计算机科学,在大学期间我同时学习了数学和计算机科学,这在我的班级里是比较少见的。现在,我们喜欢从斯坦福大学以及所有其他顶级项目招募人才。这些人在数学和计算机科学方面都非常精通。其中很多人甚至是物理学家,因为物理学家必须处理难度很高的数学运算,而且他们的大部分工作在计算上都有很大限制。因此,他们必须具备一定的计算能力和技能。我觉得深层次的技术变得越来越重要,我们很早就朝着这个方向做出了准备,这是一种幸运。
主持人:这是一个很有意思的观察,技术问题再次成为企业的竞争优势。那我们来聊聊人工智能。我的意思是,现在每个人都在关注这个问题。你重新回到Google来做这件事。你们在许多方面都处于前沿,而且竞争异常激烈。进入人工智能基础设施领域的资金达到了数千亿美元的级别,即使对单一公司来说也是如此,这非常不寻常。你现在如何看待这个行业格局?人工智能领域正在发生什么?
Sergey Brin:好的,让我想想如何回答,而不是一味地自我吹嘘。这确实是一笔巨大的投资。我想说,在某些方面我们确实犯了错,因为我们的投入不足,而且没有像现在这样认真对待它。比如说,大约八年前我们发表Transformer论文的时候,我们没有认真对待,也没有投入资源去扩展计算能力。而且我们当时也过于担心将它提供给用户使用,因为聊天机器人可能会说出一些不恰当的话。OpenAI 抓住了这个机会,这对他们来说是件好事。这是一个非常聪明的洞察。我们的同事,比如伊利亚(Ilya),也加入了他们并做了这件事。
但我相信,我们仍然从那段悠久的历史中受益匪浅。我们在神经网络相关的研究和开发方面有大量的积累,这可以追溯到Google Brain。这其中也有一些运气成分。不过,我们聘请杰夫·迪恩(Jeff Dean)不是靠运气。当然,我们能请到他很幸运,但我们当时就有这种理念,认为那些深层次的技术非常重要,所以我们聘请了他。我们从Digital Equipment Corporation(Deck)招募了很多人,因为实话实说,他们当时拥有顶尖的研究实验室。
他对神经网络充满热情,我认为这源于他大学时的实验。他做过很多令人称奇的事情,比如在16 岁左右就能弄懂神经网络,同时还在关注治疗第三世界疾病,但他对此充满热情,并建立了整个项目。实际上,当时在他所属的 Google X 部门,他是在做这些,但我并没有过多干预,我的想法是,好吧,杰夫,你放手去做吧。
他说:“哦,我们可以分辨猫和狗了。”我当时想:“哦,好吧,真酷。”但你必须信任你的技术人员。很快,他们就开始开发所有这些算法和神经网络,并将其应用到我们的部分搜索业务中。后来,我们开发了Transformer模型,从而能够做越来越多的事情。
所以我们拥有基础和研发部门。虽然多年来我们投资不足,没有像本该那样认真对待,但我们也为此开发了芯片,比如TPU,这可以追溯到大约12年前。最初我们使用GPU,我们可能是最早使用GPU的用户之一。接着我们使用了FPGA,然后尝试开发自己的芯片。这些芯片现在已经迭代了无数代。我认为,正是对追求深层技术、获取更多计算能力和开发这些算法的信任,造就了今天的局面。
与此同时,我们也是计算领域长期重要的投资者。我们拥有规模庞大的数据中心,我想不出除了亚马逊AWS之外,还有谁能达到那样的规模。我们拥有自己的半导体、深度学习算法等,构成了整个技术堆栈,使我们能够在现代人工智能的前沿发挥作用。
三、人工智能的浪潮与未来
John Levin:你是怎么看待这个问题的?我的意思是,技术每年都在不断进步。有一群人对人工智能的未来有不同的设想,比如AI 真的能做到人类能做的一切吗?至少是在计算机面前,甚至更广泛地看。那个世界会是什么样子?你对技术的发展方向有什么看法?
Sergey Brin:我的意思是,这个领域的创新速度本身就非常惊人,而且竞争异常激烈,尤其在美国顶级公司和中国顶级公司之间。如果你错过了一个月的人工智能新闻,你就会落后太多,就是这样。那么它会走向何方?我不知道,我觉得我们根本不知道智能是否存在上限。除了你提出的问题,比如它能做人类能做的一切吗?还有一个问题是:它能做人类做不到的事情吗?
John Levin:是的。
Sergey Brin:那涉及的就是一个超级智能的问题。我认为这仍然是未知数,一个实体到底能有多聪明?人类已经进化了几十万年,甚至数百万年(指灵长类动物),但与人工智能的发展相比,这个过程是相当缓慢的。
主持人:你觉得我们是否已经为技术进步的这个速度做好了准备?
Sergey Brin:目前为止,我认为人们确实从这项技术中获得了巨大的益处。尽管有时会有一些末日般的预测,但目前每个人都能熟练使用它。老实说,人工智能有时会愚蠢到让你哭笑不得,以至于你必须时刻监督它。但有时它们又非常聪明,能给你一个很棒的主意。尤其对于非专家来说,偶尔,比如我想弄清楚如何制造一款新的AI芯片,AI就能提供帮助。
我认为这非常难,很难准确预测将会发生什么。如果我们回顾互联网、手机等的出现时刻,这些都深刻地改变了我们的社会,确实改变了人们从事的职业类型以及人们所学习的内容。而人工智能将百分之百会改变这一切。但现在很难在一个迅速变化的环境中准确说出会怎样。我们今天拥有的AI与我们五年前拥有的那种人工智能大不相同,也与我们将在五年内拥有的那种AI不同。所以,我也不知道。我觉得真的很难预测。
我的意思是,我肯定会利用AI为自己带来好处。有很多事情可以用它来做。就我个人而言,无论是为我的朋友或家人挑选礼物,还是为新产品集思广益,或者做艺术创作之类的事情,我现在一直都在求助于AI。而且它并不是为我直接完成任务,因为我通常会要求它给出五个想法,诸如此类。也许其中有三样会是垃圾,我一眼就能看出来。但会有两个想法带有某种光彩,或者能帮我把它放到更恰当的角度,让我能够加以润色,帮助我把我的想法理清楚。
主持人:让我直接问一个非常具体的问题。我们大约有250名学生在这里。他们中很多是本科生。很多人还没有选择专业,因为我们在斯坦福给本科生很大的灵活性。几年前我们可以预测,会有大量人选择计算机科学作为他们的主修。你是在建议他们继续选择计算机科学作为他们的主修吗?他们应该认真考虑这个专业吗?
Sergey Brin:我选择计算机科学是因为我对它充满热情。所以对我来说这有点显而易见。我想你可以这么说,我很幸运,因为我也处在一个变革性的领域里。我不会因为现在的AI 在编程方面可以表现得相当不错而选择不学计算机科学。AI 在许多事情上都相当出色。编程恰好具有很高的市场价值,这就是为什么很多人会追求它。而且,更好的编码造就更好的 AI。所以很多公司,包括我们自己的公司,致力于这项工作的公司都非常重视它。我们在自己的编码工作,甚至在我们的算法想法等方面大量使用它,但那是因为这是一件如此重要的事情。
我想我不会仅仅因为觉得AI擅长写代码就转去学比较文学。老实说,AI在比较文学上可能表现得更好。我不是要不尊重比较文学专业的学生,但当你使用AI写代码的时候,说实话,有时候它并不奏效,像是它会犯一个相当重大的错误。然而,你在一篇关于比较文学的论文里把一句话写错了,并不会真的有那种后果。所以说,老实说,AI做一些那种创造性的事情更容易。
主持人:我觉得这是一个非常有趣的观察,关于这项技术。因为我认为,人们有一种倾向,认为AI将非常擅长解决这些技术问题,但它不一定会做我们与人类相关联的那些特质,比如在对话中表现出同理心。如果你让其中一个AI引擎模拟一段对话,它在很多方面做得相当不错,能够为复杂对话提供结构。我觉得实际上,我很喜欢你指出的那种不确定性。
还有一个问题,然后我想开放讨论,让观众有机会提问。所以这是工程学院的百年纪念。如果你是詹妮弗,并且必须开启学校的第二个世纪,你会为工程学院的第二个世纪考虑些什么?
Sergey Brin:哇,好的。那确实是一个需要谨慎规划的重要责任。我想我得重新思考“拥有一所大学”意味着什么。说实话,现在信息传播得非常快。而且许多大学,显然,很多东西都转到了线上,包括斯坦福。不过,麻省理工学院早期就有开放课程件,以及所有那些走这条路的初创公司,比如Coursera、Udacity。所以教学在某种程度上正在被传播,现在任何人都可以上网了解它。你可以和一个 AI 对话或参加这些课程中的一个,并观看这些YouTube视频。
那么我想,“拥有一所大学”意味着什么?人们会搬家,远程工作,跨地区协作。这有点矛盾,因为我们正试图让人们真正回到办公室,而且我认为他们面对面一起工作确实更有效,但那是在某个特定的规模下。比如在某种程度上,如果你有一百个人聚在一起,情况就还算可以。
而且我确实越来越多地看到某种个人主义。那些创造新事物的人,不太在乎学位与否。我的意思是,尽管我们招聘了很多学术明星,我们也招了大量没有学士学位的人,或者类似那种,他们就自己想办法弄清楚,在某个奇怪的角落里自己摸索。我不知道。我觉得这真的是一个很难的问题。我想我并不觉得我会神奇地交付出你会喜欢这个新配方,但我只是认为这种格式更可能会是为未来一百年准备的那个。
主持人:你把它带到了比我更深的方向。
Sergey Brin:哦,抱歉。
主持人:不,实际上很棒。语气稍微更深沉了一点。
John Levin:我同意。这适用于整个大学。你实际上提出了关于大学的最根本问题。那一部分大学的使命在于知识的创造和传播。这是根本任务。随着技术进步,这些可以通过不同的方式来实现。然后还有一个关于“有善心”模型的问题,人才密集于一处,有点像彼此碰撞,这当然就是促使你创建谷歌的原因之一,并且也带来了许多伟大的成果。那样的替代方案会出现吗?在大学校园上形成的那种生态系统吗?或者,那有多根本?它会继续吗?其实我本来以为是那样的,感谢你提出这么深刻的问题在本次会议中。好了,我想确保我们给观众中的其他人一些提问的机会。
四、问答环节
听众:谢谢你们的时间。我叫Rasha Barve,来自堪萨斯城,正在学习 MSENIR。我的第一个问题要问Sergey。这实际上正好涉及我们刚才讨论的内容。谷歌在很大程度上起源于你在关于PageRank 撰写的学术作品中的一部分,而如今行业在推动大量当今创新方面发挥着如此重要的作用,你仍然觉得学术界到行业管道至关重要吗?如果是这样,你会如何加强它?
Sergey Brin:哇,这是个好问题。学术界到产业界的输送管道重要吗?这个我得说我不知道,因为我想,当我还是研究生的时候,从某个新想法出现到某些事情可能具有商业价值的大致时间跨度,花了几十年。
我的意思是,在学术界你有自由考虑一段时间。你申请资助,做这做那,你大概可以花上几十年去反复思考这件事,然后它慢慢渗透。然后,最终也许会有某个大公司或者你的初创公司去推进它。问题是,如果那个时间线大幅缩短,这还合理吗?
我认为有,我认为确实有一些事情是完全合理的,而且我肯定,即使在人工智能领域,我们也会定期关注斯坦福以及其他大学的研究,偶尔我们会雇佣那些人并与他们合作之类的。但我想我并不清楚他们是否需要有那种时间段。他们比如说某种新的注意力机制,花了几年时间做实验,然后以某种形式将其带入了产业界。我的意思是,显然工业界也在做所有那些事情。所以这可能不是一个很有力的论点。激进的全新架构和类似的东西,或许会有影响。
但问题在于,这基本上是时间问题,那个行业将会扩展,而且会快得多。我想,量子计算会浮现在脑海。某种程度上首次被头脑风暴出来,我也说不清,费曼大概是什么时候提出这个想法的,像是八十年代之类的吗?有点像假设这个观点关于量子计算的。现在有一大堆公司被包括在内,他们算是在这么做。也有大学实验室尝试一些新的方法来做这件事。这有点说不准,可能还处于观望阶段。
如果你有一些完全新的想法,比如你不像我们那样做超导量子比特,或者其他的,也许你需要让它在大学里慢慢发酵若干年。那些事情有点难。这可能有道理,但到了某个时候,如果你觉得它确实很有吸引力,你很可能会继续推进并以某种方式将其商业化。
我想给你一个明确的答案,因为顶级公司现在确实在投入更多更基础的研究。我认为这在某种程度上是随着AI的兴起开始的,那些投资正在得到回报。所以我想这会改变你会做的那些努力的分配。但我确实认为仍有一些事情是这样的,确实需要像那种更纯粹研究的十年时间,那种更偏向基础研究的时期,那可能会让公司更不愿意去推进,因为那样会导致上市时间太长。
主持人:好的,下一个问题在这边。
听众:大家好,我叫Arnov,我是计算机科学和数学专业的大一新生。我的问题是给Sergey Brin的。随着人工智能以前所未有的速度加速,有抱负的年轻创业者应当具备什么心态?像我这样的人如何调整,以避免重复早期的错误?
Sergey Brin:我想,当你有一个很酷的新可穿戴设备想法时,你要先真正彻底打磨它,而不是急着去弄什么涉及跳伞和飞艇的特技宣传。这只是一个建议。
其实,我更喜欢我们以前的做法,回到Google Glass时代。Google Glass是一个早先错误的例子。我想我当时试图太快地将它商业化。我们本可以做得更好,在成本上实现更好的性价比,在精致度上达到消费者所需的水平。我当时有点操之过急了,以为自己是下一个史蒂夫·乔布斯,可以立刻把这个东西做出来。这大概就是我犯下的一个错误。如果总结起来,大家都觉得自己会成为下一个史蒂夫·乔布斯。我确实犯过那样的错误。但他确实是个相当与众不同的人。
所以,我想我的建议是,确保你已经充分酝酿并把想法开发到足够成熟的阶段。因为一旦你开始,就会感觉像踏上了一台跑步机:外界的期待会增加,开销也会随之增加,你必须在某个时间点前完成交付。你可能没有足够的时间来完成你想做的一切。那种滚雪球般的期待感会让你措手不及,而你却没有给自己足够的时间来应对。这是我本想尽量避免的错误。
听众:感谢你们的演讲。我叫Esha Bargetag,是斯坦福大学的大一本科生。这个问题是给Sergey Brin和Jennifer的。我们看到很多人工智能公司通过扩展数据和计算资源来改进大型语言模型。我的问题是,一旦我们真的耗尽了数据和算力,接下来的发展方向会是什么?是会转向更新的架构,有没有可以替代Transformer的方案?还是会有更好的学习方法,比如超越监督学习或用于训练大型语言模型的强化学习(RL)?或者是一个完全不同的方向?你们以前考虑过这个问题吗?谢谢。
Sergey Brin:是的,从我的角度来看,你列出的这些因素中,算法进步已经成为比仅仅扩展计算或数据更重要的因素。人们关注扩展,可能是因为它涉及到建设数据中心和购买芯片,OpenAI和Anthropic关于各种缩放法则的论文也吸引了很多注意力。但我认为,如果你仔细审视,会发现过去十年左右,算法的进展实际上已经超越了单纯的规模扩展。
在很久以前,当我读研究生时,我见过一张关于N-body(多体)问题的图。比如,模拟受引力作用而运动的多个物体。自五十年代人们开始关注摩尔定律带来的计算能力增长以来,这种增长是巨大的。但在九十年代我读到时,用于解决N-body问题的算法进步,实际上已经远远超越了计算能力的扩展速度。
所以我想你会发现,像我们这样的公司永远不会拒绝处于计算前沿。但这更像是主菜之后的甜点,或者说是在你完成算法工作后才拥有的配菜。
主持人:我想插一句,关于计算资源或数据耗尽,或者更准确地说是算力不足的问题,我们在这里非常熟悉。对于大学来说,很难拥有像那些公司一样的计算能力。我们甚至远远达不到那种程度。但这确实促使我们在创新领域做了很多工作,去研究当计算资源更少时会发生什么,以及如何用更少的资源做更多的事情。我们在这方面已经做了很多研究。
听众:大家好,我叫Andy Zivortsy,是化学工程专业的二年级研究生。我的问题是想问在座的各位演讲者,你们认为哪项新兴技术在长期影响方面被严重低估了?谢谢。
Sergey Brin:我显然不能说人工智能,因为它很难被反驳它的重要性。但它可能仍然被低估了。不过,它可能已经不算是一项“新兴”技术了,所以我们不用它来回答。
很多人确实对量子计算将带来什么感到好奇。不过,我可能不会完全依赖它来回答这个问题,尽管我绝对支持在量子计算等领域的研究。但这个领域还有许多未知数。从技术上讲,我们甚至不知道P是否不等于NP。在计算领域,有太多的未解之谜。量子算法针对的是大家所知的、具有非常特定结构的问题。我非常支持这方面的研究。
但很难具体说清楚。我的意思是,或许可以将这两种技术的应用场景都考虑进去。除了量子计算之外,还有材料科学。如果我们能使用不同种类的材料,我们能在很多方面做得更好,它的潜力可以说是没有上限的。
John Levin:其实我也在想材料科学方面。但“被低估”这个说法有点意思,因为现在有很多关注点放在技术创新的机会上。对于像核聚变能或量子计算这样尚未成熟的技术,很难说人们会忽略它们,或者说它们现在没有得到足够的关注,就像人工智能一样。但在我看来,材料科学会是其中一个被低估的领域。在生物学和健康领域也有很多机会,特别是在分子科学中。它现在受到的关注可能不如人工智能,但在分子科学领域也正在发生一场巨大的革命。
主持人:是的,我本来也想说同样的话。我感觉聚光灯正在转移。现在聚光灯主要照在人工智能上,但它曾经照在生物学上,而且不应该停止照亮生物学。合成生物学领域正在发生各种各样的突破。我曾经有过一些扩展性的经历,它们在当时看来以一种痛苦的方式改变了我的世界,但后来却为我的个人经历带来了回报。那些艰难的过渡是值得的。
听众:大家好,我叫Zena。感谢大家前来,我要问你们一个经常问演讲者的问题:您刚才提到,您很喜欢保持敏锐,并掌握人工智能及其他领域正在发生的事情,那您会读哪些书呢?
Sergey Brin:我只是听他们说,看看发生了什么。但我确实更喜欢进行互动式讨论,比如在我的车里,我经常和内部版本的Gemini交流。尽管这听起来可能有点尴尬,你们现在公开版用到的模型版本其实相当古老,我自己在车里用的那个版本要强得多,大概几周后我们就会把它推向市场。
主持人:好的。这有点像对未来的一瞥,是个不错的结尾。
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。如对本稿件有异议或投诉,请联系 tougao@huxiu.com。