三道坎:万亿美元AI军备竞赛的真正瓶颈
创始人
2026-03-14 15:49:44

(来源:可遥笔记)

一块H100显卡,2023年出厂价约2.5万美元。三年过去,它没有贬值——反而更值钱了。

原因不复杂。三年前跑在H100上的模型,能力有限,商业价值有限。今天的前沿模型,同样一块卡,每小时能创造的经济价值翻了好几倍。硬件在折旧,用途在升值。升值跑赢了折旧。

这是SemiAnalysis创始人Dylan Patel在最近一次深度访谈中提出的观点。他在这次对话中系统拆解了AI算力扩张面临的三重瓶颈——逻辑芯片、内存、电力——以及围绕这三道坎展开的万亿美元军备竞赛。

数字触目惊心。亚马逊年度资本支出2000亿美元,谷歌1800亿,全球大厂合计超过6000亿美元。这不是泡沫式的烧钱——各家都在抢的,是一张通往AGI的入场券。而这张入场券的供给,最终取决于三样东西的产能。

第一道坎:逻辑芯片

AI芯片的心脏是逻辑芯片,逻辑芯片的命脉在台积电。

台积电生产了全球80%以上的先进制程芯片。一座1GW级AI数据中心,大约需要5.5万片3纳米晶圆和6000片5纳米晶圆。英伟达早早锁定了台积电3纳米产能的70%以上,签约到2027年。苹果正被挤出3纳米,转向2纳米。谷歌的TPU时间表一度推迟,把产能让给了英伟达。

产能争夺战已经白热化。但这还不是终极瓶颈。

真正的天花板,是台积电上游的阿斯麦。

EUV光刻机,单台造价3至4亿美元。阿斯麦目前年产约70台,2026年计划提升到80台,乐观情景下到2030年或许能达到100台以上。

Dylan Patel算了一笔账:3.5台EUV光刻机,支撑1GW的AI芯片产能。1GW数据中心的总投资约500亿美元,供应链上下游产生的AI经济价值可能达1000亿美元。而这1000亿美元的价值,锁在3.5台光刻机上——价值12亿美元的设备。

12亿卡住1000亿。杠杆率惊人。

阿斯麦的供应链有上万家供应商。光源来自圣地亚哥的Cymer,把锡滴用激光电离产生极紫外光,正在从500瓦升级到1000瓦。光学系统来自蔡司,每台光刻机需要18面多层反射镜,全球能做这项工作的高级技工不到1000人,背后是250年积累的供应链。

这不是工业制造,是手工艺。产能无法快速扩张。

到2030年,全球累计约700台EUV光刻机,理论上支撑约200GW的AI算力。听起来不少——但Sam Altman的OpenAI一家就提出过每年52GW的需求。半导体产业还没有真正意识到AGI级别的需求意味着什么。

第二道坎:内存

大语言模型有一个被低估的事实:它们的瓶颈不是算力,是内存带宽。

HBM(高带宽内存)是AI芯片的"秘密武器"。但HBM的生产效率远低于普通DRAM——同样面积的晶圆,HBM只能产出普通DRAM三分之一到四分之一的容量。堆叠工艺、硅通孔互联、更低的良率,都在吃产能。

供给掌握在SK海力士和三星手中。价格已经翻了两到三倍,新签的两三年期合同都在高位锁定。英伟达为确保供应,签下了总额约900亿美元的长期内存采购合同。

900亿美元,只为锁住内存供应。这个数字本身就说明了稀缺的程度。

2023年H100的主要瓶颈是CoWoS先进封装——把芯片和HBM封装在一起的工艺。台积电的封装产能跟不上。到2027-2028年,随着逻辑芯片产能释放,HBM可能成为整条供应链上最紧的一环。

业界正在探索替代方案。对于不要求极低延迟的推理任务——批处理、后台agent、异步服务——普通DDR5内存或许够用。这能分流一部分HBM压力,把稀缺的高带宽内存留给真正需要的场景。

第三道坎:电力

AI目前消耗西方约1%的发电量,却占用了50%以上的先进制程芯片产能。

这个不对称说明:短期内,电力不是最紧的瓶颈。芯片是。但电力的天花板正在逼近。

美国电网每年增长约2%。GW级数据中心2026-2027年开始落地。到2030年,AI数据中心可能消耗美国电网的10%。

大厂各显神通。谷歌在疯狂买燃气轮机和土地,为2027-2029年储备电力。微软通过CoreWeave、Oracle和软银能源扩展产能。马斯克最早打破常规,用非传统发电方式解决算力中心的供电问题。

燃气轮机是电力供应链的另一个咽喉。重型工业燃气轮机交付周期3到4年,到2028年的产能基本售罄。限制因素是涡轮叶片的铸造——全球只有3家铸造厂能做,产能都排满了。

替代方案在涌现:航改型燃机、联合循环反应堆、往复式柴油发电机。但每一种都有局限。电力不会在短期内成为致命瓶颈,但它是一个缓慢收紧的绳套。

瓶颈在移动

Dylan Patel最有洞察力的判断,不是哪个瓶颈最重要,而是瓶颈一直在移动。

2023年,卡在CoWoS封装——H100交不出货。2024到2025年,卡在电力和数据中心建设。2026年,回到半导体制造——3纳米晶圆产能。2027到2028年,轮到HBM内存。2028到2030年,最终落到供应链的最底层——阿斯麦的EUV光刻机。

每解决一个瓶颈,下一个就浮出水面。这不是某一个环节的问题,是整条供应链在同时被拉到极限。

军备竞赛的经济学

谁在花这些钱?怎么花的?

英伟达处于食物链顶端。在供不应求的环境下,毛利率80%到90%。Blackwell架构的整机柜系统功率超过120千瓦,重新定义了数据中心的基础设施。英伟达还在分化产品线——专门用于上下文预填充的CPX、标准GPU、专用工作负载的GR芯片。

GPU租赁市场同样火热。H100的租赁价格在每小时1.4到2.4美元之间。早期签下5年长约的公司,锁定了巨大的成本优势。后来者只能按现货价格接盘——而现货价格已经充分反映了AI模型的经济价值。

先手优势在算力军备竞赛中被放大到极致。谁早签约、早囤货、早锁定产能,谁就赢在起跑线上。这不是技术问题,是供应链博弈。

大厂的资本支出规模前所未有。亚马逊2000亿美元,谷歌1800亿,Meta在2026年新增的算力相当于2022年整个机群的总量。这些钱不是一年花完的——相当一部分用于未来几年的设备定金、土地储备和电力采购协议。

OpenAI的目标是2026年底达到5到6GW的算力。Anthropic同样在5到6GW的量级,年化收入预计超过600亿美元,但毛利率不到50%,还需要约500亿美元的资本支出来维持增长。

投入之大,令人咋舌。但反过来想——如果AGI真的到来,这些投入的回报将是天文数字。军备竞赛的逻辑就是:不投的风险,远大于投错的风险。

中国的位置

Dylan Patel对中国的判断很直接:取决于时间线。

如果AI的关键突破在2026到2030年之间发生——快时间线——美国赢。基础设施领先优势和算力规模差距太大,中国来不及追。

如果时间线拉长到2035年以后——慢时间线——中国有机会。中国正在纵向整合整条供应链。DUV光刻机有望在2030年前实现国产化,年产约100台。EUV光刻机可能在2030年前后出现可工作的原型,但量产还需要很长时间。

华为的昇腾芯片正在通过先进封装而非制程突破来扩展算力——和上一篇文章讨论的中国AI芯片路径如出一辙。

一个值得关注的变量:随着出口管制收紧,中国AI模型越来越难从美国前沿模型中进行知识蒸馏。自研能力的重要性在上升。

12亿美元的咽喉

退一步看全局。

万亿美元在涌入AI。大厂在抢芯片、囤内存、买电力、签长约。整个产业链被拉到极限——从光刻机到涡轮叶片,从硅通孔到燃气轮机。

但所有这些投资、所有这些竞争,最终都要通过几个极窄的咽喉。阿斯麦年产不到100台光刻机。全球能铸造涡轮叶片的工厂只有3家。能做HBM堆叠封装的产线屈指可数。

万亿美元的产业,悬在十亿美元的瓶颈上。

这就是AI军备竞赛最深层的矛盾:需求在指数级增长,供给在线性增长。每一个瓶颈被突破,下一个就在等着。这场竞赛的终点不取决于谁最有钱,而取决于谁最能解决供应链上最窄的那个环节。

算力是AI时代的石油。但石油有替代品,光刻机没有。

本文基于SemiAnalysis创始人Dylan Patel在Dwarkesh Podcast的深度访谈,仅供信息参考,不构成投资建议。

相关内容

热门资讯

最新或2023(历届)感恩主题...  每年的11月的第四个星期四是感恩节,今年的感恩节你最想要感谢的人会是谁呢?一起来参考下小编给大家整...
学生感恩节国旗下讲话稿 幼儿园...  最新或2023(历届)学生感恩节国旗下讲话稿【1】感恩  亲爱的同学们:  我们的人生之路总是阳光...
最新或2023(历届)学生联合...   联合国糖尿病日的前身世界糖尿病日(WorldDiabetesDay,WDD)是由世界卫生组织和国...
最新或2023(历届)国际大学...  际大学生节又称“世界大学生节”、“世界学生日”、“国际学生日”。节日的设立是为了控诉暴徒血腥的罪恶...
关于最新或2023(历届)国际...  一、活动背景  本活动灵感来源于“国际大学生节”又称“世界大学生节”、“世界学生日”、“国际学生日...