炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:纪要研报地)
CPO产业进展;CPO交换机与电交换机成本比较,CPO交换机bom成本拆分和核心组件价值量、供应商。scaleup方向,OIO、OCS全光交换机、AEC铜缆等路线比较。英伟达blackware和rubin光模块配比变化,asic厂家光模块配比变化。
Q&A
CPO产业进度?
各大厂商如英伟达、博通、马威尔等都已发布CPO产品,并持续进行研发,这是一个确定性的技术方向。CPO概念2020年提出,过去四五年一直处于预研阶段,没有真实产品,2025年可以看做CPO交换机的元年,博通51.2TCPO交换机在2025年4月已经实现小批量出货,微软、字节、腾讯登客户都采购了博通的CPO,并在内部小规模组网试用,英伟达2025年4月发布CPO交换机,115.2T,拥有144个800g端口,2025年9月已进入小批量生产阶段。博通预计2025年出货3500套CPO交换机,英伟达预计2025年不到3000套CPO交换机。2026年,博通CPO交换机目标在1.2万台以上,英伟达规划出货量1.5万台。
普通电交换机和CPO交换机成本比较和拆分?二者优劣势?
从成本上来看,目前差别不大,CPO方案略高。以英伟达Q3450为例,该型号有电交换机版本和CPO版本,容量均为115.2T,内部采用4颗28.8T交换芯片,区别在于电交换机使用可插拔光模块,安装在交换机外部插槽,而CPO交换机集成了1.6T硅光引擎在内部。电交换机版本售价约6万美元,搭配1.6T光模块,通常配套72个1.6T光模块,每个光模块在2026年大规模出货时最低价格约为800美元,光模块价值量5.76万美元,因此该版本合集11.76万美元。
CPO交换机目前价格约为13万美元一台。
电交换机加光模块的方案,优势是不需要一次性购买所有光模块,数据中心建设通常先采购机架和交换机,根据业务流量逐步增配光模块。对于二三线数据中心建设方来说,这种灵活增配方式更友好,因为资金压力较大。对于云厂商来说,这不是问题,谷歌、微软等有充足资金。
英伟达Q3450CPO交换机的BOM成本拆分?
物料成本约为五六万美元。
核心部分是4颗28.8T芯片,这是英伟达自研的,成本较低。
最贵的部分是光引擎,相当于将外部光模块集成进来。每个1.6T光引擎约480美元,交换机内部使用72个1.6T光引擎,价值量3.456万美元。这部分包括了FAU,72个,每个50美元,英伟达光引擎是天孚通信做,博通光引擎目前是泰科电子旗下的fabrinet做。
光源,需要18个外置光源模块,每个模块包括8个300毫瓦CW激光器,单个300毫瓦CW激光器约为30美元,组成外置光源模块后价格400美元(增加基板、隔离器、保偏光纤等,以及天孚等生产厂家的利润),18个外置光源模块价值量7200美元。
fibershaper,精密耦合,太辰光通过康宁交付英伟达,1000多根光纤做的光柔线板/光理线器,大概2500美元。
MPO,放置在交换机外部,144根连接线,每根40美元,一共5760美元,太辰光也做。不一定要英伟达配好,可以客户自己买。
天孚通信在CPO交换机中,除了做光引擎,还能做哪些部分?天孚通信CPO客户结构,卡位情况?旭创等光模块厂家在CPO时代的机会?
除了光引擎,还可以做光源模块的封装。
英伟达方面,天孚是国内唯一厂商,在英伟达一级供应商里,直接供应光引擎和光源模块。思科、博通有业务合作,2021年签了代工协议,只是目前思科、博通的CPO还没有上量,天孚还没有直接量产。
CPO和光模块相比,是个封闭生态,或者行业内叫“贵族俱乐部”,光模块产品是标准化的,CPO产品是定制化的。技术上很多人都能做,但是必须进入到CPO交换机大厂的供应链里,才有机会参与定制开发和后续生产。
旭创等也在储备技术,未来目标是给英伟达、博通等做CPO光引擎方案或者代工,旭创等硅光芯片比较领先,这也有利于其做CPO。
未来大家都有机会。
CPO一定要用硅光方案吗?EML和VCSEL方案怎么看?
EML确定不行,功耗太大,体积太大无法集成,CPO里空间非常紧凑,要放在交换芯片周围,密度要求很高。
过去大家统一用硅光,现在博通、IBM、英特尔等也在做VCSEL方案,因为硅光方案难度大、成本高。现在VCSEL也可以做高集成度,比如1×16阵列的VCSEL芯片,体积也可以做得没那么大。VCSEL芯片的优点是成本和功耗更低,缺点是传输距离更短,可靠性和寿命比硅光差。VCSEL不是完全没机会,现在不好说。未来在短距离内,VCSEL最远30米,博通在推scaleup网络方案,比如组几百卡的集群,组1到10个柜以内的互联网络交换机,VCSEL方案的CPO有机会,但在scaleout网络,也就是当前CPO,都是用硅光,因为传输距离远。
硅光方案是不是有上限?比如到了单通道200g、400g再往上是不是就不太行,要转薄膜铌酸锂路线?
目前行业普遍认为纯硅材料下,极限是单波长或单通道200g速率,这是基于现有硅调制器结构,比如MZ或微环调制结构,加上等离子体色散通过掺杂差异实现的。未来也不排除有创新结构,学术界已经在研究纯硅做448g调制带宽,不能说绝对不行,只是当下材料和结构技术上只能做到单波200g。未来有创新结构,硅光仍有机会冲击448g,但这两三年甚至四年内都不一定有产品出来。
产业界认同的技术方向是单波200g可以用EML和硅光,单波400g可能只能用EML和薄膜铌酸锂。未来有没有更创新的技术让硅光突破400g,持开放态度。
薄膜铌酸锂供应商?
薄膜铌酸锂技术目前还没有大规模量产,但不少公司在布局,包括华为在自研薄膜铌酸锂,旭创也收购了极客光合团队。
市面上做得比较好的公司包括:1)海外:日本的富士通做铌酸锂材料和调制器很早,传统电信市场用的铌酸锂占了70%份额,薄膜磷酸锂两三年前就开始做。北美有一家哈佛大学的创业公司,薄膜铌酸锂现在也有单波200g产品,下一步做单波400g调制器,新易盛就用这家公司的产品做了不少光模块demo。2)国内:不比海外差,甚至可以更领先,因为国内薄膜铌酸锂产业链比较完善,最上游从铌酸锂晶体材料到新硅聚合、济南金盾做铌酸锂薄膜,再到下游无锡尼奥光电、宁波圆心光电、珠海光库科技、苏州极客光合、武汉安泰光电、南京南智光电,包括华为九峰山实验室都在布局薄膜铌酸锂调制器。
目前CPO交换机主要用于scaleout领域吗?
是的,目前第一代的博通和英伟达CPO交换机,要么用以太网协议,要么用InfiniBand协议,都是用在scaleout网络,实现跨设备互联。
scaleup方向,CPO同路径的OIO、OCS全光交换机、AEC铜缆,几条路线比较?
跨柜scaleup:铜缆无法满足需求,必须用光。
柜内scaleup:英伟达目前NVL72用的DAC铜缆,AWS用AEC铜缆。未来柜内scaleup是光铜并进,即使在柜内也会用大量光。英伟达和康宁一直在推进OIO方案,未来单芯片可达几十T,直接在芯片上集成硅光引擎,一个光引擎可能达到12.8T容量,放六七个,全部直连光纤,每个芯片都直接出光,这种方案性能最强、带宽最大,但系统最复杂、成本最高,并不是所有AI芯片都要采用这种全部出光的方案,只有顶级芯片用于大模型训练、需要极高扩展性的时候才会采用这种方式,一般组网不需要那么大规模,可以用铜。
举例说明,scaleup和scaleout带宽是怎么算的?
以英伟达GB300GPU为例:scaleout组网通过网卡实现,跑的infiniband或以太网协议,每个GPU配一个标准网卡,GB300配的是CX8网卡,速率为800G,因此800g就是单GPU的scaleout带宽,英伟达scaleout现在一般是三层网络。scaleup通过铜缆连接组网,跑的nvlink协议,单卡带宽1.8TB/s,1个B等于8个bit,因此就是14.4tb/s,这是针对双向带宽,因此跟光模块相对应的单向速率就是7.2tb/s,英伟达scaleup目前是一层网络,英伟达预留了nvl576架构下两层nvlink,但成本太高,现在大模型参数也不需要那么宽带宽。因此考虑单卡带宽和网络层数后,scaleup带宽基本为scaleout带宽的3-4倍。
OCS光交换机方案在scaleup层面应用情况?这种方案中光模块使用情况?
目前scaleup网络用ocs的是谷歌,其他家正在评估,ocs时延等指标都很好,但是使用ocs有门槛,怎么样做好数据调度,跟芯片设计、算法都有关系,不是每个厂商都能把ocs的优势发挥出来。谷歌ocs实现更大规模的组网,每个柜子64卡,64个柜子,4096卡组成集群,使用ICI网络协议,用48台ocs交换机连接。
谷歌论文有数据,目前给谷歌供应的ocs定制的光模块。由于ocs交换机损耗更大,因此需要发射的功率更大,要节省光通道数量,因为ocs基于光通道切换,所以要用到波分复用,要用尽可能少的光纤,要用到环形器,这里面很多部件,腾景科技可以供货。
4个TPU组成一个板卡,6个光模块接口,需要接到OCS交换机上去,OCS交换机本身没有光模块,它是一个全光交换设备,但芯片本身跑的是电信号,要使用ocs交换机,还是得先用光模块把电信号转为光信号才能进到ocs交换机里。每个芯片为了跟ocs交换机连接,是1:1.5的配比。定制光模块比普通英伟达采购的光模块贵40%,涉及很多光学器件。
OCS能用于scaleout网络吗?
OCS的应用在AI领域潜力很大,应用场景也很广泛。OCS在scaleout网络端可以替代部分spine脊交换机,但不能替代所有交换机,因为它主要针对通道切换,对流量模式有相对稳定的要求,不能切换太频繁。所以在上层流量模式相对固定的场景下,用OCS替代传统电交换机,可以获得更低功耗、更低时延和更低成本。在底层一些交换机,数据交换切换非常频繁,其实用OCS并没有什么优势。所以在scaleout网络端,OCS可以作为补充,面对上层一些大流量场景进行替换。谷歌也做了相关研究。OCS还可以用于DCI网络,即数据中心之间的互联,微软也在评估采购。
scaleup领域推出一些小型的,比如64×64端口的OCS,补充电交换机的不足,这也是可行的。谷歌也在其scaleup网络中使用OCS。
目前scaleout和scaleup的几种路线中,哪一种更成熟,下一个能商用的是哪一个?
AI技术发展非常快,技术路线多元化,各有各的做法,很难判断未来哪种技术会一统天下。不同厂商会根据自身大模型和数据中心规模、性能要求选择不同架构。
英伟达的升级路径很明确,从无源铜缆升级到正交背板,再到CPO,终极方案是OIO,英伟达与台积电一直在推进这项技术。2027、2028年后会上AEC环节吗?目前来看较少,但像旭创与瑞可达合资在做AEC,也在给英伟达送样,未来不排除英伟达在部分产品或规格上采用AEC,但这不是主流技术选择。正交背板应该是英伟达比较重要的技术,但它可能无法完全实现柜内所有卡的互联。比如下一代Rubinultra(NVL576),576个die,对应128张卡(rubin一个芯片封装4个die),128张卡分为四个区域,每个区域32张卡,区域内32张卡互联走正交背板,需要四个正交背板,正交背板之间需要AEC连接,这是一种混合方式。rubinultra之后,更终极来看,可能会用OIO技术。
谷歌有自己独特的技术路线,目前很少提到OIO,甚至CPO也很少提及,主要是往OCS方向发展。第一步是在柜内使用DAC铜缆,下一步会升级到AEC,跨柜则继续用OCS,OCS也会升级,比如更大端口数,或者采用除MEMS以外的新技术,比如德克利正在做的光波导方案,目前已经在采购样品。
英伟达blackware和rubin光模块配比的问题?
Blackware网卡不需要1.6t光模块,交换机侧需要1.6t光模块,两根光纤接到两个网卡上。RUBIN理论上讲,网卡从CX8的800g升级到CX9的1.6t,但是明年CX9的1.6t出不来,所以英伟达的rubin配置里,单rubin芯片配两个800g网卡,一个computetray里有4个rubin芯片,配8个800g网卡(现在是四颗blackware芯片配四个800g网卡)。原来blackwareultra(gb300)基于三层网络架构需要2.5个1.6t,rubin明年下半年出货后,同样三层网络配5个1.6t光模块,这就是为什么英伟达10月大幅加单1.6t光模块的原因(rubin提前了)。
在十一之前,英伟达今年(2025年)5月就开始采购1.6T,主要是为blackwareultra(gb300)配套,现在已经在出货。GB300机柜的网卡是800G,但到交换机侧,两个网卡会并到一个1.6T上。英伟达选择更高集成度、更好性能的1.6T交换机,主因1.6t交换机占用空间更小,一个1.6T光模块功耗只需25瓦,而两个800G需要30瓦,可以节省20%的功耗。
目前除了英伟达产品,1.6t以太网交换机客户都买不到,博通、marvel的产品要明年年中甚至下半年才能出来(基于其tomahark6芯片),因此现在客户要买就得买英伟达的全套方案,因为外面配不到,英伟达把兼容性都做好了,缺点就是贵。因此现在1.6t光模块都是英伟达直接采购。后续技术成熟了,客户可以自己外采。
ASIC现在一般是几层网络,光模块配比如何?
ASIC趋势也是一样,未来网络规模越来越大。比如AWS给Anthropic做的是40万卡集群,谷歌明年(2026年)TPU甚至要搭百万卡集群,和GPU一样都在向更大集群发展。ASIC配比光模块的量也看不同厂商,谷歌基本只看scaleout,大概是1:3左右,AWS更多用AEC铜缆做第一层scaleout互联,配比大约1:2,Meta大约1:3~1:4,但如果明年(2026年)Meta在scaleup大规模上光模块,配比可能超过1:8,这也是Meta明年800G采购量最大的原因(跨柜光互联,非常类似华为CM384方案,CM384方案就是放在12个机柜里面,每个机柜32张卡,通过1:14的光模块配比连接)。
新易盛之前在光芯片物料上有压力,现在这个问题解决了吗?
有一定解决。新易盛三季度因芯片问题,库存消耗很快,影响了生产和发货。四季度硅光进一步上量,内部目标是提升硅光产能,随着硅光上量,对传统芯片需求会缓解。同时,新易盛与博通在谈明年(2026年)长期供应协议,博通新扩产会主要支持新易盛,新易盛也参与了英伟达方案的代工,英伟达也在帮助新易盛协调lumentum芯片产能。
总体来看,新易盛在光源芯片方面,最紧缺的时刻已经过去,但短缺问题短期一两个季度内无法完全解决,只是比过去稍有改善,仍然供不应求。
正交背板,如果良率合格,您觉得会在144这个版本用吗?最早什么时候会开始用?
正交背板英伟达评估了很长时间。英伟达的目标是在Rubin这一代就开始用,也就是Rubin144。但英伟达一贯策略是不会押宝某一项技术,现在铜缆技术继续用,正交背板也持续验证不同厂商方案,包括良率、不同材料性能对比等,同时也在考虑OIO、CPO、LPO、AEC等方案。英伟达的策略是所有方案同步推进,采用赛马机制。到某个节点,芯片和机架必须出货时,哪个方案ready、最合适就用哪个方案。
如果正交背板改善速度较慢,良率不达标,到明年(2026年)下半年还达不到量产要求,可能会先沿用DAC铜缆方案量产。
上一篇:李维嘉等同志拟任职务公示