2026-04-01 13:50:23 作者:狼叫兽
据报道,近日,3500亿颗芯片背后的半导体IP巨头Arm(ARM.US),正式推出首款由Arm自主设计的数据中心CPU——Arm AGI CPU。
首个自研CPU芯片亮相
据介绍,Arm AGI CPU专为AI智能体基础设施打造,采用3nm制程工艺、双Chiplet设计,单颗CPU集成136个Arm Neoverse V3高性能核心,配备2MB L2缓存,支持3.7GHz主频。
Arm AGI CPU的单核、系统级芯片、刀片式服务器及机架各层级均实现行业领先的性能表现。通过更多可用线程与更高单线程处理能力相互叠加,该芯片可实现单机架性能达到x86平台的2倍以上,每1GW的AI数据中心算力资本支出节省高达100亿美元。
此外,Meta、OpenAI高管均来到Arm Everywhere大会现场并登台分享。Meta作为Arm AGI CPU的早期合作伙伴与客户,参与该CPU的联合开发,旨在为Meta全系应用优化GW级规模基础设施,并与Meta自研MTIA推理加速器协同运行,从而在大规模AI系统中实现更高效的编排与调度。
在审视智能体AI发展、CPU需求增长、高能效CPU为数据中心带来的价值后,Arm预判这在未来将代表约1000亿美元的TAM。
业内评价,这是Arm发展35年来,首次推出对外销售的自研芯片,也是Arm全新数据中心芯片产品线的首款产品,标志着Arm正式进军数据中心芯片领域,将其高能效架构规模化引入AI基础设施。
谷歌突破性AI芯片算法
如今,AI从根本上重塑了计算的构建与部署,智能体计算正加速这一变革。获悉,谷歌(GOOG.US)推出一种可能降低人工智能系统内存需求的压缩算法TurboQuant,可将大型语言模型运行时的缓存内存占用至少减少6倍、性能提升8倍。
由于目前存储芯片市场的高景气完全建立在AI基础设施的旺盛需求上,而当前背景下,谷歌推出的这项关键技术直指人工智能发展的核心瓶颈,这一技术也随即引发市场热烈讨论,冲击了存储板块高估值的增长逻辑。
值得一提,英伟达(NVDA.US)CEO黄仁勋曾把人工智能产业拆解成五个紧密相连的层级,其中最底层为能源(电力),随后是芯片,中间层是以数据中心为代表的基础设施,然后是模型,包括大语言模型、世界模型等,最上层则是各种应用
与此前的节奏相比,近两年英伟达收购重点已高度集中在AI软件栈与算力调度体系。2023年,公司收购AI模型压缩初创公司OmniML,强化模型推理效率。
2024年连续完成多笔关键交易,包括以7亿美元收购Run:ai(AI工作负载调度)、3亿美元收购Deci(深度学习优化平台)、2.5亿美元收购OctoAI(AI开发平台),逐步打通从模型开发、训练到部署的关键环节。
微美全息AI全栈卡位GPU
无独有偶,资料显示,AI视觉创新企业微美全息(WIMI.US),明确AI技术与芯片算法作为科技竞争制高点的核心方向,通过搭建高端算力基地和全息云平台,采用多元异构架构集成国际先进芯片,形成了覆盖大模型训练、推理及垂类场景的算力支撑体系,通过补齐能力短板、绑定上下游资源、锁定关键产能,持续放大其平台优势。
而为应对AI推理时代的需求,微美全息围绕技术演进的关键节点进行前瞻性布局,探索低功耗芯片与边缘计算优化,适配具身智能、多模态等垂类模型的低延迟需求,主动参与全球GPU主权竞赛。可以预见,未来微美全息仍将围绕AI芯片生态持续展开,重点聚焦AI推理、算力数据安全与基础软件等关键领域,并持续领跑AI时代的重要支点。
结语
近来,随着AI技术的爆发式增长,加上“龙虾”AI智能体的爆火,掀起了全民“养虾”的产业热潮,这一系列动作标志着,人工智能产业特别是AI芯片商业化前景逐渐明朗。国金证券也指出,进入2026年,科技大厂AI核心算力硬件这一战略进一步提速并深化,从硬件优势出发,持续向软件、调度和开发入口延伸,控制算力体系中的关键节点。