(来源:刘润)
01
通往未来的路,居然要靠一辆“买菜车”
前几天,我又去逛了世界人工智能大会(WAIC)。
说“又”,是因为我去年就来过。文章放在了2条,欢迎你去看。这次,我们搞了件“大事”——现场直播。为此,主办方特意支援了我们一套装备:
一个装着8张上网卡的WIFI。和一个“买菜车”。
(哼哼。厉害吧。)于是,在这场科技大会里,出现了有点儿滑稽的一幕。一位同事,满头大汗地拉着一辆神似“买菜车”的小推车,小心翼翼地跟着直播手机挪动。在人群里挤啊挤。
人来人往,我们手忙脚乱。但信号,还是断断续续。
这一幕,像极了我今年对AI大会的感受。去年,充满了整个会场的,除了炫酷的表演,还有焦虑。因为,大部分展台,都不知道自己有什么用。所以,只好表演。但今年,大家终于不再表演了。
因为他们,都开始试着去解决一个个具体、甚至有点狼狈的问题。就像这辆拉着WIFI,笨拙但有效的小推车。
那些曾经高高在上的技术,终于愿意沾点泥,去干点笨活、脏活、累活了。虽然看起来不太聪明,但踏实。这让我发自内心地,感到高兴。
分享一些我不成熟的感受。可能说的不对。你听听看。
02
终于开始在“手”上下功夫了
手。全是手。好多手。
具身智能展馆。第一感受,就是好多手。这些手,在给人按摩,拧螺丝,倒咖啡,下棋……相比去年,跳舞的机器人少了,长“手”的机器人多了。
(图片可左右滑动)行业正在从“展示能力”,进化到“改变世界”。
为什么这么说?因为,手,才是我们真正改变物理世界的器官。腿,只是把手运来运去而已。
但是,把手做好,很难。非常非常难。
举个例子,力反馈。
我们拿起铅球,会用力抓紧。但拿起鸡蛋,就会小心翼翼。因为皮肤能感受压力。没有力反馈,当机器人拿起纸杯子,没等装上爆米花,就给捏扁了。
再举个例子,低延迟。
如果让专家远程给人做手术,它的延迟要求,就非常苛刻。因为下刀的深度,容不得一点差错。如果这边下刀,那边还没动。这边下刀了,那边就割错了。这就是一条命啊。
灵巧、精准,和几乎为零的延迟。要做好一只手,这些缺一不可。
真好。所以,我特别期待。期待明年再来大会,能看到更多的手的应用。比如,炒菜。比如,叠衣服。甚至剥鸡蛋。
当机器人能用手干更多活,它离真正改变世界,就又进了一步。
当然,同样是“干活”,水平和水平,也不一样。
03
真正的智能,不是拿来表演的
在展馆里,总有几个展台被围得水泄不通。
比如,打冰淇淋的机器人。它用自己的机械臂,取杯、接料、递出,一板一眼。观众们感到特别新奇,纷纷举起手机。
但是,如果你想真正看懂人工智能,就不能只看热闹。
你仔细看。机器人的旁边,站着一位工作人员。他的任务,就是把每次用来打冰淇淋的空杯子,放在机器人旁边。为什么?为什么一定要有这个工作人员?机器人自己不能拿吗?
难说。
因为这大概率,不是智能化,而是自动化。
这台机器人的所有动作,手伸到哪里取杯子,在冰淇淋机下面停多久,转几圈——可能都是预设好的。如果杯子不在那个区域,它就“看不见”,动作就会产生偏差。就像一个老式的八音盒,你拧了发条,它就只唱那一首歌。不管有没有观众。
真正的智能,不是拿来表演的。
它必须,是一个“感知-决策-行动”的闭环。能看到世界,并做出新的行动。而行动,又可以拆得更细。腿,负责移动平衡。臂,负责大概动作。手,负责精细交互。
用这个框架,我们再看一个例子。
机器人打拳。它厉害在哪?是出拳的力量和速度吗?不是的。那些只是预设好的“表演”动作。它的厉害,不在拳,而在腿。挨了一拳,或者打空之后,身体会瞬间失去平衡。这时,它感知到姿态的变化,控制器立刻计算出需要调整的力矩,然后驱动几十个关节,重新站稳。
所以,再看到机器人表演,你或许可以问这么几个问题。
它到底在展示什么能力?是腿的平衡,臂的精准,还是手的灵巧?它有没有用到眼睛(感知)?它有没有展示出思考(决策)?
看懂了这些,你才算真正看懂了机器人。
04未来的机器人巨头,可能藏在汽车行业里
如果要帮你干活,机器人最重要的能力是什么?
是那双灵巧的手吗?是那个逼真的脸吗?这些都很重要。但是,让一个机器人,去厨房给你拿一瓶水,它得一路走过去,避开沙发,绕过睡觉的猫咪。在这个过程中,最核心的能力,是它能像人一样,在三维空间里自由地行走、避障、交互。
这种能力,就是:空间计算。
那么,你觉得,在空间计算这个领域,投入最多研发,积累最多数据,甚至交了最多学费的,是那些机器人公司吗?
不是的。是汽车公司。
自动驾驶的汽车,需要在复杂的城市道路上行驶,得能在一秒钟内,同时识别突然窜出的外卖小哥,突然变道的网约车,还有行人、路灯……对“空间计算”能力的要求,比一个在你家客厅里端茶倒水的机器人,高得多。
机器人,本质上就是低速的自动驾驶。
所以,这也是为什么马斯克一边造特斯拉,一边又在发布机器人的原因。这也是为什么大疆,一个做无人机的公司,最近突然开始做扫地机器人。因为他们都明白,技术,是可以迁移的。
所以,如果你真的想知道,能帮你做家务的机器人什么时候能够出现,或许你不应该问那些机器人公司的创始人。
你应该去问问,马斯克,问问李想和何小鹏。
因为,未来真正的机器人巨头,可能藏在汽车行业里。但是,即使技术难题解决了,商业上的挑战,依然巨大。比如现在,一个能帮你做家务的机器人,出现在面前。
你会立刻买单吗?
(看到护理机器人,我高兴坏了。毕竟年过半百,也到年纪了。)05
机器人的早期机会,属于B端
所有新技术的商业化,几乎都面对一个问题:
它必须先去解决“贵”的问题。
什么意思?我给你算笔账。在上海,你请一位阿姨去家里打扫卫生。假设一个小时30元。假如有一台家务机器人,也能帮你打扫卫生,但大概率不如阿姨利索,一小时要100元。你愿意吗?你肯定不愿意。这就是C端的逻辑:你的机器人,不仅要比人好,还要比人便宜。
所以,机器人早期的机会,在那些“人更贵”的地方,“问题更贵”的场景里。
比如,工业场景。日复一日,24小时不停地拧螺丝。比如,巡检场景。去深夜的化工厂,直面可能存在的有毒气体。把比如,救援场景。灾后人进不去,有危险的废墟底下,探测生命迹象。你看,在这些地方,机器人解决的,是危险、是重复、是人力的极限。
它不再是用100块的成本,替代30块的服务。而是用20万的成本,去解决一个100万的问题。
这些场景,都是典型的B端场景。
当然,这个巨大的未来,靠几家巨头公司单打独斗,是完不成的。它需要一个全新的,产业生态。
06
最赚钱的机器人公司,可能不造机器人
这次逛展,让我无数次停下脚步的,不是那些试图大包大揽,造出一整个机器人的公司,而是把小事情做到极致的小公司。
有人选择,做“手”。
他们不造机器人。他们只研究“手”。就像机器人世界里的神经外科医生。日复一日地研究,怎么让手,更灵活、更有力、更敏感。
有人选择,专攻“表情”。
他们也不造机器人,他们研究,怎么让机器人微笑、惊讶、皱眉。秘密,就藏在硅胶皮肤下的30多个电机上。
还有人,在数据上做努力。
他们,搭建了成千上万个包含椅子、沙发、桌子的模拟场景,帮助训练家务机器人。机器人在里边跑,摔倒,学习。1天,就能获得之前1年的训练数据。
他们虽然不造机器人,但他们都切切实实,找到了产业的一环。
这让我想到了汽车。什么时候,汽车工业才真正迎来了大爆发?是有人说,我能造一辆车的时候吗?不是的。是有人说,我不造车了,我只研究轮胎的时候。有人说,我不造车了,我只做玻璃的时候。
当一个宏大的目标,被拆成1万个具体的难题的时候,这个产业,才算真正走在了爆发的前夜。
而汽车行业里,最赚钱的公司,很多都不造车。比如,做芯片的,做传感器的,甚至,做电池的。因为,当他们把一个“零件”做到全世界最好,那所有想造车的公司,就都离不开他。
所以,未来最赚钱的机器人公司,可能也是只造“零件”的公司。
好了。聊完机器人的商业逻辑,就看懂了它的当下。但要理解它的未来,我们必须去更深的地方,去看驱动它的算法。
也就是,大模型。
07
AI最大的价值,是用“标准化成本”,实现“个性化极致”
给你说个秘密。
我现在每天最主要的娱乐,就是和谷歌的大模型,Gemini聊天。
根据一些测评的结果,它的智商,据说已经到了130。100个人里,可能只有2人是这个水平。所以,和它聊天,已经不是简单的问答。它更像一个,知识渊博但不知疲倦的智力教练。比如,你问它“英特尔的运营模式”,它就能从芯片行业的发展史,聊到IDM模式,还能聊到大象转身。甚至聊到金融、生物。
它不只是在回答我的问题,而是在激发我的思考。
既然我作为一个在商业和科技,有长期积累的人,都能在和AI的聊天中,获得巨大的启发,那么其他人呢?比如,一个对物理充满好奇的中学生?又比如,乡镇医院里的医生?
这,或许就是AI最大的价值。用“标准化成本”,实现“个性化极致”。
请你思考一个问题。
这个世界上,最好的教育,是什么样子的?你要问我,那我可能会说,孔子。一个老师,带着几个学生周游列国,随时随地答疑解惑。这种因材施教的效果,当然是最好的。还有,太子太傅。全国最好的大学士,尽心竭力,只教太子一人。
这就是,“个性化”的某种极致。
但是。它太贵了。那怎么办?
那就,标准化。写一本书,印刷一百万册,让学生自己去看。这个成本,当然极低,但一百万个学生,能学到多少,可就千差万别了。
这是一对,几乎不可调和的矛盾。你要极致的效果,就要付出天价。你要极低的成本,就要接受最差的效果。
但AI的出现,彻底改变了这个局面。
你想拥有一个24小时陪你,上知天文,下知地理的口语老师吗?过去,这至少要一小时几千块。今天用AI,可能一小时,只需要几块钱。
同样的情况,也发生在医疗行业。
你想让中国几十万乡镇卫生所的水平,都接近北上广三甲医院吗?科大讯飞正在做这件事情。他们正在把三甲医院老专家的知识和经验,变成AI辅助诊断系统,交给千千万万个在基层奋斗的年轻医生。
过去,我们用钱购买稀缺。未来,我们用AI消灭稀缺。
好了。现在,我们看到了那座,搭建在未来和现在之间的桥。但建造这座桥的砖瓦,却不止我们眼前的这些大公司。
它们来自,更深、也更微小的地方。
08
真正的未来,不在聚光灯下
创新孵化展示专区。
如果说,一楼和二楼的那些巨大展台,代表的是AI的现在——那些已经获得了巨大声量的公司。那么,地下这些3、4米宽的小格子,孕育的就是AI的未来。
这里的灯光更暗、展位更小。但离未来,更近。
每个格子,通常只有一个显示器,一个易拉宝,和一两个略带羞涩、但眼神里闪着光的年轻人。
比如,这位26岁的小伙子。
他还在清华读博,就已经创办了一家公司。他特别认真地介绍:你看,芯片上每个小方块里,都有64000个标记点。我们可以通过它,检测蛋白质标志物,指导医生用药。
又比如,这位刚从斯坦福硕士毕业的年轻人。
目前,他从事的领域是:量子计算。什么是量子计算?之前,计算机的最小信息是0或者1。就像灯泡要么灭要么亮。但量子计算机的“灯泡”,可以同时处于“灭”和“亮”的叠加态。这让它在某些问题上,能同时考虑所有答案。所以,之前50年才能算完的加密算法,量子计算理论上,10分钟就搞定。
听完他们的介绍,我的心里有种说不出的激动。这不光是因为他们的项目前沿,更是因为,他们选择投身了一条更难,更寂寞,但对整个国家来说,也更重要的路:
基础科学,和硬科技。
当看到他们,你不得不打心眼里觉得,中国有希望。因为一个国家的希望,不在于它有多少高楼大厦,而在于:
最聪明的那群年轻人,到底在为什么而奋斗。
09
不要觉得自己是文科生,数学不好就是应该的
聊到最后,我还是忍不住,想给你一个建议。
有机会,还是学学编程,和数学。
前几天,黄仁勋也谈到了这个问题,他说未来,人们应该多学学数学、推理和编程。我特别同意。这些基础能力,是你理解和使用AI的底层能力。靠它们,你才能判断AI的输出质量,开始创新。
可在中国,文理分科这件事,让很多人一辈子拒绝学习数学和编程。
我数学不好,应该的。我逻辑不强,天生的。我的大脑,就是“文科生”的大脑。可是,干嘛非要这样呢?凭什么你的大脑,在16岁那年,就被定义了呢?你数学不好,逻辑不强,大概率,不是因为你的“头脑”不行。
而是因为,你没有遇到一个好的数学老师。
对。锅不要自己背。把它甩给你的数学老师。
10
通往未来的路,从不是一键直达
好了。回到这一届WAIC展。回到那辆“买菜车”上。
过程中,还有个小插曲。为了带着设备上下楼,我们四个人满头大汗地找了半天直梯,最后只好举着小车走了扶梯。对。就是最开头那张图。
这有点狼狈,甚至有点滑稽。但这辆笨笨的小推车,可能就是今天,AI最真实的样子。它不再满足于只在云端展示肌肉,而是想去拧一颗具体的螺丝,识别一个具体的癌细胞,找到一个优秀的候选人。
或许,通往未来的路,从不是一键直达。它总是充满了意想不到的、具体的,甚至有点可笑的阻碍。
但不要紧。因为我相信,只要那些充满朝气,想要改变世界的年轻人还在,只要这群愿意拖着笨重小车,也愿意去看未来的人还在。
这条路,就一定有走到的那天。
参考资料
观点/ 刘润 主笔/ 景九 编辑 / 歌平 版面 / 黄静
这是刘润公众号第2673篇原创文章。未经授权,禁止任何机构或个人抓取本文内容,用于训练AI大模型等用途
PS:AI,是最近5年,甚至10年,怎么都绕不开的大话题。
为了弄懂它究竟会如何改变我们的商业世界,这一年我会一直在路上。咨询、参访、请教、游学。然后,我会把这一整年的精华,浓缩成一场4小时的演讲。在10月25日的年度演讲上,与你汇报。
10月25日,上海。我们不见不散。