来源:环球网
【环球网科技综合报道】5月16日消息,据外媒报道,谷歌旗下人工智能研发实验室DeepMind近日宣布,其开发出一款名为AlphaEvolve的新人工智能系统,能够以“机器可分级”的解决方案处理问题,在数学和科学领域展现出独特价值。
在实验过程中,AlphaEvolve系统成功帮助优化了谷歌用于训练其AI模型的部分基础设施。目前,DeepMind正着手构建与AlphaEvolve交互的用户界面,并计划在进行更广泛推广之前,先为选定的学者推出早期访问计划。
大多数人工智能模型存在“幻觉”问题,即由于其概率架构,有时会自信地编造信息,较新的模型如OpenAI-o3甚至比上一代更容易出现这一情况,凸显了该问题的挑战性。对此,AlphaEvolve引入自动评估系统这一巧妙机制来减少幻觉。该系统会利用模型生成、评估并得出问题的可能答案池,同时自动评估和评分答案的准确性。
需要说明的是,AlphaEvolve并非首个采用此类策略的系统。早在几年前,包括DeepMind团队在内的研究人员就已在多个数学领域应用过类似技术。不过,DeepMind强调,AlphaEvolve使用了“最先进的”Gemini模型,这使其能力远超早期的人工智能实例。
使用AlphaEvolve时,用户需向系统提出问题,并可选择包含指令、公式、代码片段和相关文献等详细信息,同时必须提供一种以公式形式自动评估系统答案的机制。由于该系统只能解决能够自我评估的问题,所以主要处理计算机科学和系统优化等领域的特定类型问题。此外,AlphaEvolve只能将解决方案描述为算法,这使其不太适合解决非数值问题。
为对AlphaEvolve进行基准测试,DeepMind让该系统尝试了一组精心挑选的约50道数学题,内容涵盖从几何到组合学的各个领域。DeepMind称,AlphaEvolve在75%的情况下能够“重新发现”这些问题最广为人知的答案,并在20%的情况下找到改进的解决方案。
在实际问题评估方面,比如提升谷歌数据中心的效率以及加快模型训练速度,AlphaEvolve也有出色表现。据实验室透露,其生成的算法平均可持续回收谷歌全球0.7%的计算资源,还提出了一项优化建议,将谷歌训练其Gemini模型的总时间缩短了1%。
不过需要明确的是,AlphaEvolve尚未取得突破性发现。在一项实验中,该系统发现的谷歌TPU AI加速器芯片设计的改进,此前已被其他工具标记过。
尽管如此,DeepMind和许多人工智能实验室一样,认为AlphaEvolve能够节省时间,让专家们将精力集中在其他更重要的工作上。(纯钧)