英伟达不再独霸?谷歌AI芯片算力追平B200
创始人
2025-04-10 13:42:17

4月9日,在拉斯维加斯举办的 Google Cloud Next 25 大会上,谷歌推出了第七代TPU---Ironwood。该芯片专为支持大规模思考和 AI 推理模型设计,是谷歌迄今为止性能最强的TPU。

TPU (Tensor Processing Unit)即张量处理单元,是一种专门为加速深度学习任务而设计的人工智能芯片,由谷歌公司在2015 年首次提出,第一代TPU于2016 年正式发布。

官方表示,Ironwood 的推出标志着人工智能及其发展基础设施,从提供实时信息供人类解读的响应式人工智能模型,到能够主动生成洞察和解读的模型的转变。

在推理时代,Agent将主动检索和生成数据,以协作的方式提供洞察和答案,而不仅仅是数据。而实现这一点,需要同时满足巨大的计算和通信需求的芯片,以及软硬协同的设计。

Ironwood 最高配集群可拥有9216个液冷芯片,峰值算力42.5 ExaFlops,也就是每秒运算42500000000000000000次。

据nextplatform介绍,该芯片是谷歌首款在其张量核心和矩阵数学单元中支持 FP8 计算的 TPU。

Ironwood的FP8算力为4614 TFlops,略高于英伟达B200标称的4500 TFlops。内存带宽7.2TBps,略低于B200的8TBps。

此外,Ironwood 芯片中使用到的第三代 SparseCore 加速器编码了各种算法,可以实现加速金融和科学计算的目的。

SparseCore 加速器首次亮相于 TPU v5p,并在去年的 Trillium 芯片中得到了增强。它的最初设计目的是加速推荐模型,而这些模型利用嵌入来跨用户类别进行推荐。

官方数据显示,Ironwood的每瓦性能是去年发布的第六代 TPU Trillium 的两倍。每芯片容量达到192 GB,是 Trillium 的 6 倍,能够处理更大的模型和数据集,减少频繁数据传输的需求,并提升性能。

谷歌计划在不久的将来把TPU v7整合到谷歌云AI超算,持包括推荐算法、Gemini模型以及AlphaFold在内的业务。

据悉,OpenAI联合创始人兼首席科学家Ilya Stutskever的AI初创公司Safe Superintelligence 正在利用Google Cloud的TPU芯片来支持其AI研究。

相关内容

热门资讯

财通可持续混合净值下跌3.30... 财通可持续发展主题混合型证券投资基金(简称:财通可持续混合,代码000017)公布3月3日最新净值,...
广发轮动配置混合净值下跌3.5... 广发轮动配置混合型证券投资基金(简称:广发轮动配置混合,代码000117)公布3月3日最新净值,下跌...
华安生态优先混合A净值下跌3.... 华安生态优先混合型证券投资基金(简称:华安生态优先混合A,代码000294)公布3月3日最新净值,下...
国泰聚信价值优势灵活配置混合C... 国泰聚信价值优势灵活配置混合型证券投资基金(简称:国泰聚信价值优势灵活配置混合C,代码000363)...
建信中证500指数增强A净值下... 建信中证500指数增强型证券投资基金(简称:建信中证500指数增强A,代码000478)公布3月3日...