英伟达不再独霸?谷歌AI芯片算力追平B200
创始人
2025-04-10 13:42:17

4月9日,在拉斯维加斯举办的 Google Cloud Next 25 大会上,谷歌推出了第七代TPU---Ironwood。该芯片专为支持大规模思考和 AI 推理模型设计,是谷歌迄今为止性能最强的TPU。

TPU (Tensor Processing Unit)即张量处理单元,是一种专门为加速深度学习任务而设计的人工智能芯片,由谷歌公司在2015 年首次提出,第一代TPU于2016 年正式发布。

官方表示,Ironwood 的推出标志着人工智能及其发展基础设施,从提供实时信息供人类解读的响应式人工智能模型,到能够主动生成洞察和解读的模型的转变。

在推理时代,Agent将主动检索和生成数据,以协作的方式提供洞察和答案,而不仅仅是数据。而实现这一点,需要同时满足巨大的计算和通信需求的芯片,以及软硬协同的设计。

Ironwood 最高配集群可拥有9216个液冷芯片,峰值算力42.5 ExaFlops,也就是每秒运算42500000000000000000次。

据nextplatform介绍,该芯片是谷歌首款在其张量核心和矩阵数学单元中支持 FP8 计算的 TPU。

Ironwood的FP8算力为4614 TFlops,略高于英伟达B200标称的4500 TFlops。内存带宽7.2TBps,略低于B200的8TBps。

此外,Ironwood 芯片中使用到的第三代 SparseCore 加速器编码了各种算法,可以实现加速金融和科学计算的目的。

SparseCore 加速器首次亮相于 TPU v5p,并在去年的 Trillium 芯片中得到了增强。它的最初设计目的是加速推荐模型,而这些模型利用嵌入来跨用户类别进行推荐。

官方数据显示,Ironwood的每瓦性能是去年发布的第六代 TPU Trillium 的两倍。每芯片容量达到192 GB,是 Trillium 的 6 倍,能够处理更大的模型和数据集,减少频繁数据传输的需求,并提升性能。

谷歌计划在不久的将来把TPU v7整合到谷歌云AI超算,持包括推荐算法、Gemini模型以及AlphaFold在内的业务。

据悉,OpenAI联合创始人兼首席科学家Ilya Stutskever的AI初创公司Safe Superintelligence 正在利用Google Cloud的TPU芯片来支持其AI研究。

相关内容

热门资讯

热议!韩国“一姐”因揭发丑闻获... 近日,有关国羽女单最强对手、韩国名将安洗莹因揭露韩国羽协的腐败行为而获得高达5000万韩元奖励一事,...
张雪回应比赛提前结束:如果继续... 4月19日,2026世界超级摩托车锦标赛(WSBK)荷兰站WorldSSP组别第二回合正赛,驾驶张雪...
杨幂代言的背背佳卖爆了,“不差... 出品 | 创业最前线 于莹 4月10日,可孚医疗港股IPO申请正式通过聆讯,距离“A+H”两地上市...
原创 “... 金三角这个地方,地图上能找着,但管不着。它横在泰国、老挝、缅甸三国的交界处,山连着山,河套着河,一条...
冷评丨12306拒了百万张票,... 海报新闻编辑 王云峰 4月16日至18日,12306拒绝出票105.6万张,70.4万笔交易被拦下...