01
前天,2026年国际消费电子展(CES)闭幕,这一次展会去了很多中国企业,包括我身边的一些企业家也飞赴拉斯维加斯参加这场科技盛宴。
有的企业家跟我说,这一次参展刷新了他们对于物理AI的理解,就像进入了一个新的智能世界。
什么意思呢?
过去,我们都是在跟屏幕里的AI对话,但今天不管是端到端AI、智能体还是智能机器人都在爆发,并且开始进入到越来越多的真实场景。
换句话来说,AI正在从屏幕后走出来,开始真正接管一些需要“实时观察、逻辑判断、精准动作”的物理任务。
特别是这一次英伟达的突然参展,黄仁勋发布的下一代人工智能计算平台Rubin更是在改写AI发展的底层逻辑。
所以,我们专门做了深度研究,我觉得非常有必要让大家知道这个世界正在发生什么,以及未来我们要面对什么。
02
为什么在CES茫茫多的创新产品中,我会单独把英伟达的Rubin拎出来呢?
因为Rubin正在重塑整个计算工业乃至AI时代的底层架构。
我们知道,在传统的计算模型中,CPU、GPU跟网络组件通常是独立优化后再进行集成,从而运行计算。
但Rubin采用了所谓的“极端协同设计”方法,把处理器、互联网络、存储协议、安全防御、散热和电源作为一个连贯的系统进行全堆栈优化。
这么做意味着什么呢?
第一,英伟达不再仅仅是提供算力芯片这个产品,而是提供一套完整的智能解决方案,一种可以持续生产“智能”的工业化流水线。
第二,Rubin平台让AI计算“以芯片为中心”转向“以系统为中心”。
把所有核心芯片以及配套的互联架构加在一起,Rubin的晶体管总数达到了恐怖的220万亿个。
而且,由于所有芯片同出一源,它的各项性能比之前已经是最强的AI芯片“Blackwell”还要强出数倍。
甚至,我们可以说这已经不是一个物种了。
Blackwell归根结底是零配件,就像是一台超级发动机,买回去还要搭配各种配件,用极其复杂的工程优化手段把它组装成一台跑车。
而Rubin是一条标准化的汽车生产线,是一个即插即用的工业化产品,拿着它进行调配,就能开始提供智能。
那么,它会带来什么呢?
1、打破AI的协同瓶颈。
以前的AI不能协同吗?
能,但有延迟。
以前的AI系统是由不同厂家组装的零件,GPU算得飞快,但CPU传数据慢,网络带宽就像早高峰的单行道,大家都在互相等待。
就像之前某个爆火的AI大模型,我相信很多人都遇到了对话框在转圈、无法回答的问题,就是这个原因。
如果在物理世界里,AI出现了这样的问题,这种迟疑就是致命的失误。
而Rubin是把6颗专门设计的芯片绑成了一个“一体化大脑”,就像是一个自带默契的交响乐团,每一个眼神(信号)和动作(计算)都是同步的,这种零距离协同让数据传输速度达到了每秒260TB,比全球互联网的总带宽还要大。
2、打破AI的思考极限。
以前的AI不能推理吗?
能,但仍然是浅层模拟。
之前的AI主要是依靠对数据的收集跟理解进行预测跟思考,就像背题库的学生,看到题目直接报答案,它其实很难真正理解背后的逻辑。
所以,我们的提示词很重要,要给AI设定方向、范围,需要引导AI进入到我们想要的那个思维链当中。
但是,Rubin专门为“思维链推理”优化了硬件层面的算法支持,使得相同的硅片面积可以释放出5倍的推理吞吐量,直接支撑了需要海量Token输出的复杂推理任务。
所以,它允许AI在输出之前进行数千次的内部思考的步骤,相当于AI学会了复盘和推演。
它在回答之前会自问自答几千次:“如果我这样走,会撞到人吗?”、“如果那个人突然跑过来,我该怎么办?”
AI就不再是猜答案,而是真正算出那个最合理的行动方案。
这种逻辑推演让它能处理现实世界中那些突发场景跟长尾场景。
3、打破AI的记忆墙。
以前的AI能不能处理大数据?
能,但代价很高。
AI的短期记忆叫KV缓存,它非常占地方,一旦我们对话太长,或者要处理的数据太多,AI就会爆内存,要么变傻,要么变慢,然后提醒你重新开一个对话。
英伟达在Rubin这个系统中专门做了一个存放AI记忆的平台(ICMSP),通过专有芯片(BlueField-4 DPU)直接管理数据。
所以,以前AI的记忆就像写在便签纸上,贴满了GPU的全身,贴不下了就得撕掉。
而Rubin给AI准备了一个图书馆,记忆容量提升了,读写速度还更快了,这就让AI不仅能够进行超长的上下文对话,还能记住你在对话所有的提问,甚至是跨对话,也就是联系你其他的对话进行推理。
所以,我们做个简单的总结,我们之前使用的AI像是一个学霸,它博览群书、口才极好,但由于“体力”跟“反应能力”有限,它只能待在屏幕里跟你对话,做做翻译。
而Rubin的出现,相当于给这个学霸换上了一套战甲,它不再只是一个更快的芯片,而是一个把大脑(计算)、神经(网络)和记忆(存储)完全融合在一起的“超级智能生命体”。
那么,AI就不只是变聪明了一点点,而是整体运行成本降低了10倍,思考深度提升了5倍,从一个只能聊天对话的“聊天机器人”,变成了一个有逻辑、有记忆、能实时处理物理场景,而且是企业能够用得起的“数字工程师”。
03
黄仁勋在演讲中,有一句话让我既振奋,又焦虑。
他说:物理AI的ChatGPT时刻即将到来。
Rubin的出现,不是让我们能用到一个更聪明的AI对话聊天机器人,它核心的意义是让AI从屏幕里进入到物理世界,在各行各业带来连锁反应,特别是制造业。
我们可以设想几个场景。
像我去过的很多工厂里,所有的设备程序都是设计好的,哪怕是机械臂,也是用一行行代码规定好,比如要左转30度,抓取。
如果零件放歪了1公分,那就需要人工的干预。
但今天像卡特彼勒这样的制造商,它利用Rubin算力在虚拟世界里造了一个双胞胎工厂。
机械臂在虚拟世界里预先练习了100万次各种意外情况,当它来到真实工厂的时候,它就不是在执行固定程序,而是在观察、思考、反应。
如果传送带卡住了,AI会自动推演维修路径,甚至自己调度无人机去更换零件。
还有在供应链上,我们经常会遇到某个地区的原材料断货了,产量跌了或者是需求涨了。
碰到这样的情况,老板可能得打几十个电话,开一整夜的会,重新算产能、协调资源,计算物流路径。
现在,只需要对着屏幕说一句话,Rubin驱动的AI就能在10分钟把全球几千个客户的配货方案全部重新算好,并且算出哪种方案成本最低、最快。
还有,在今天的智能驾驶上,我们看到奔驰跟英伟达的合作,由Rubin驱动的Alpamayo模型已经开始像人类一样想问题。
当车在路边看到一个滚出来的皮球,它会预判,既然有球,那后面大概率还会跟着个人,于是提前减速避让。
同时,它还会解释这个逻辑,因为这种思考过程在Rubin架构下非常快,在人脑还在处理“前面突然多了一个球”的时候,AI已经在几毫秒内完成了思考,算好了路径,控制汽车完成避让。
这就是物理AI最核心的“工业化智能”逻辑,云端系统是AI的“生命模拟器”跟“智慧工厂”,负责生产出最聪明的逻辑。
而车端、工厂端的AI是执行终端,负责把这些智慧化作物理世界的动作。
所以,当AI从屏幕里跳出来,进入到我们的物理世界开始工作的时候,我们的企业可以想一想,我们怎么想办法去利用它?我们在下一个物理AI时代的核心竞争力是什么?
另外,英伟达透露的消息是Rubin产量有限,要到2026年下半年甚至是2027年才能陆续交付,并且对中国禁售,面对如此强悍的智能平台,中国的AI还能赢吗?
-
责任编辑 | 罗英凡
图片均来源于网络
本文不构成任何投资建议,股市有风险,投资需谨慎
■ 免责声明
本文涉及有关上市公司的内容,为作者依据上市公司根据其法定义务公开披露的信息(包括但不限于临时公告、定期报告和官方互动平台等)作出的个人分析与判断;文中的信息或意见不构成任何投资或其他商业建议,市值观察不对因采纳本文而产生的任何行动承担任何责任。