本报评论员 刘柯
本来预计今年5月就会更新换代的DeepSeek-R2,时间一拖再拖让人浮想联翩。现在很多人甚至淡忘了DeepSeek问世时的辉煌。其使用率从年初的50%,暴跌至目前的3%。
其实,业内人士对DeepSeek-R2 一直没有更新已经给出了解释,主要原因是因为R1是基于OpenAI已有的训练数据生成的,这部分训练数据来自全球且被认证过,而R2的训练数据需求量更大,国内可供R2训练的数据质量不高,导致R2的幻觉体验太严重。另一个原因则是,高端的GPU严重不足,造成DeepSeek的训练效率大打折扣,从而拖累了R2的更新。
上述两个原因都能解释得通。但是我们发现,现在并非DeepSeek单个大模型出了问题,而是几乎所有的大模型都开始停滞不前,包括曾经火爆一时的“杭州六小龙”,不断传出技术大拿跳槽和资金链吃紧的消息,存在感严重下降。这里面的一个深层次原因就是,目前几乎所有的大模型都同质化严重,而且大部分都在可有可无的智能问答中展开角逐,在语音处理和图像识别等二维感知领域徘徊。
众所周知,AIGC(生成式人工智能)能一鸣惊人在于技术的不断突破,如果大模型无法从二维感知领域实现有效突破,被时代抛弃也很正常。因此,大模型的发展方向必须从智能问答、文生图和文生视频这些简单的二维感知应用向能自主解决实际问题的智能体(AI Agent)以及更高层面的空间人工智能也就是三维感知领域拓展。
智能体比较好理解,它能通过感知环境中的变化,根据自身学习到的知识和算法进行判断和决策,进而执行动作以影响环境或达到预定的目标。智能体是最适合落地的人工智能应用,比如目前比较火的自动驾驶汽车,就是一个具有高度自主性的智能体,它能够在复杂的交通环境中感知周围的车辆和行人,并自主规划路径、控制速度和作出避障决策。此外,智能体在AI教学、AI营销和AI旅游等方面都可以实现真正服务于人的要求,而不仅仅是解决简单的问与答。
而从更高层次来看,三维感知的空间人工智能将是AIGC的最终应用。简单来说就是机器人的自主思维与应用。给机器人下达一个指令,就可以实现机器人的自我思考与运行。现在很多大模型停留在文生文、文生图和文生视频上,但却很难让机器人给你倒一杯咖啡。因此,三维感知的空间人工智能就是让机器人既有可学习与思维的类人大脑,还要能从亿万数据中学习到实际应用,这其实才是真正意义上的AIGC。
如何从娱乐化走向现实化,让AIGC真正为人类服务,提升生产效率,这才是DeepSeek们前进的方向与动力。
来源:《金融投资报》 http://jrtzb.com.cn/