想象未来某天,你的保姆机器人接到下楼买咖啡的指令,自主完成开门、乘坐电梯、寻找便利店、取咖啡、付钱等一连串动作,最后将咖啡递到你手里。
这不是科幻电影,而是具有自主进化能力的AI智能体带来的可能——不再局限于在固定场景里完成特定动作,而是能像人类一样在陌生环境里“自主学习”,并根据场景变化做出相应的动作。
作为人工智能最主要的载体,智能体由硬件、软件等多种要素组成,能够感知周围环境,并根据自身所处环境做出判断和决策。在我们的日常生活中,一辆辅助驾驶的汽车是智能体,可以根据路况自主地踩油门或者刹车;家里的扫地机器人也是智能体,能识别地板上是纸屑果皮还是灰尘,并选择合适的清洁方式。
实际上,智能体并非向来智能,它们的进化史就像一个人的成长史。早期,智能体只会“死记硬背”。例如,1997年击败国际象棋冠军的超级电脑“深蓝”,其实是存储了几十万局棋谱的“复读机”,遇到规则外的招式就会卡壳。2014年,谷歌研发的AlphaGo开启了“思维训练”的模式,智能体开始通过自我学习提升自身能力,并逐渐进阶为某个专项领域的高手。2022年,以ChatGPT为代表的大语言模型横空出世,标志着智能体发展出较高的智能水平。例如,借助AI大模型破译甲骨文时,它会自主调取青铜器纹样数据库来“脑补”生僻字的字义,甚至根据上下文的意思“创造”新字符。
与智能体进化相对应的,是智能体训练方法的变化。
AI大模型依赖于人工收集的数据进行训练。“投喂”给它们什么训练数据,就学习什么知识。例如,给它们提供100万张猫和狗的图像,并且标注清楚哪些是猫、哪些是狗,经过长时间的训练,它们就能很好地分辨猫和狗,但对于没见过的动物依然无法识别。
而下一代智能体将具备自主学习的能力——通过观察这个世界、和周围的环境互动,来学习各种技能。不需要收集和标注好100万张图像,只用几张图像教会它们最基本的知识,它们就可以自己学习更丰富的知识。例如,如果想教智能体骑自行车,只需要示范一次,它就会自己尝试不同的骑行动作,并不断试错,最终学会骑行的技巧。这意味着下一代智能体将在自主性和适应性方面更上一个台阶,能够主动获取信息,进行信息加工,然后分解任务、完成任务。
基于这种方式,若干年后的智能体或将彻底融入我们的生活:厨房里,智能灶台不仅能烹饪美味佳肴,还能记住你的口味偏好;医院里,AI医生为病人诊断出病症,带着“定制方案”找主刀医生讨论……
不过眼下,智能体的发展还远未达到人们所期望的“耳聪目明、心灵手巧”,它们只能在固定场景中完成特定任务,并不具备跨场景完成任务的能力:一个智能体可以为汽车拧螺丝,但换成轮船可能就做不到了;可以在平地上翩翩起舞,但换成山路也许就“四肢不协调”了。因此,“跨任务、跨场景、跨本体”是下一代智能体的发展目标。
随着人工智能从数字世界走向物理世界,智能体的可信性变得愈发重要。在智能体技术不断发展的过程中,我们始终需要守护“技术进步须服务于人性温暖”的文明底线,从源头上界定其行为边界与伦理规范。
(作者为复旦大学智能机器人与先进制造创新学院副院长,本报记者黄晓慧采访整理)
上一篇:奔来眼底文字流 离题万里不走心