董岩
大模型作为目前流行的效率“神器”,除了能和我们对话,提供帮助,还拥有极强的推理能力,制作表格、整理数据、补全细节全都不在话下。那么大模型“填表”的时候,我们能不能事先规定表格格式呢?
认识大模型接口:想象和一个银行经理对话
大模型虽然内部机理复杂,但它的接口却十分简洁而多态。想象着我们来到了一个银行的大厅,大厅的客户经理十分聪明,但她刚入职对业务还不熟悉。此刻,我们设置几种和经理的交互模式:聊天模式,我们和经理谈天说地,经理思路严谨,论述周全。这是我们在App和ChatBox上和大模型交互中最常见的形式;咨询模式,我们向经理咨询银行业务,由于经理新入职,无法直接给出回答,但她会根据我们的提问,去翻查相关资料,把“资料+提问”组合成一道阅读理解题,为我们作答,这个就是RAG(检索增强生成);填表模式,我们拿着一张单子去找经理,但不知道该如何填表,经理根据我们提供的信息,帮我们填表,当设置了大模型的format(格式化输出)选项或者function call(功能调用)选项时,大模型可以产生格式化输出,按要求生成“表格”或者“指令单”,类似于“填表”;跑腿模式,我们连该填哪个表单都不知道,经理根据我们提供的信息,从桌上的一叠表单中,找到了办业务需要的表单,帮我们填好表,“跑腿”把业务办好。因此,当大模型知道自己能够“填表”时,它可以多次思考,先生成“工序”再生成“工单”。
“聊天模式”和“咨询模式”我们已然熟悉。“填表模式”和“跑腿模式”需要编程,普通用户不会直接这样用,通常通过应用程序间接用。
跑腿模式:Manus的愿景与现实
大模型+工具箱=智能体。这是一个美好愿景,而且看起来已经可行。前段时间爆火的Manus,底层就是“跑腿模式”。如果你具有一定的电脑操作水平,应该了解电脑操作系统存在很多接口,其中每一个接口都有既定的参数,如果把每一个命令看成一个“表格”,其相应的参数做成表格上的“格子”,那么“让大模型自动选择表格并填表=让计算机干活”的等式就成立了。
我们当然希望计算机全程代为“跑腿”,但现实是,我们必须对工作担责,不能甩锅给智能体;相应地,智能体不能够直接代替我们,而是必须服务于我们的职责——工作成果要么可靠,要么易于评价和利用。
显然,现今的智能体还难以实现这个要求,一些自称“通用”的智能体,其实是能调用“通用的办公工具”,并非适合通用的场景。这些工具能够提高我们的工作效率,但不是革命性的变化。
填表模式:一次格式化输出的实践
相比跑腿模式,填表模式仍然以传统的应用程序为主人翁,大模型作为被调用的配角。这种模式指向明确,功能单一,但比较容易找到应用场景。
一些年代久远的计算软件没有图形化界面,纯靠文本编辑和命令行方式建模,需要翻阅厚厚的手册使用。如果要给这些软件做一个界面的“壳子”,需要大量的表单制作工作,工作量一眼望不到头。我们可以使用代码对手册信息进行提取,接下来就该大模型上场了,使用填表模式。
在格式的约束下,大模型不会产生太多的幻觉。这就像我们做主观题,如果是简答题,可能每个人的答案逻辑不尽相同,但如果是填表题,则答案会有更好的一致性。
我们连续调用了5000多次大模型,经过9小时的处理后,厚厚的手册变成了2M的结构化数据。虽然有瑕疵,但涉及大量的属性整理和制表工作,人工编制和人工纠错的工作量比起来,差别太大了。
接下来应用成果。我们再次编程对数据结构进行整理,使其满足开源表单的格式要求,于是软件的表单化界面就做好了,并且其中很多选项型的属性也转换成了选项型的界面,比文字输入要更直观。
至此,一个文字形式的软件手册,就变成了一个结构化的、交互式的表单。相当于大模型的使用“填表”能力制作了一组“表单”,手册的文字变成了软件界面!
数字化仍然是主干道
我们用大量的人类知识训练出了大模型的推理能力,使其顺便掌握了一些知识。就像我们很多理工科同学,记不得历史的细节,谈论起历史总会张冠李戴,比起AI幻觉不遑多让,但这并不影响我们用正确的历史观点分析问题——我们学的是历史事件,用的却是历史观点。
大模型也类似——喂进去的是数据,出来的是推理能力。大模型不能取代数据库、搜索引擎、应用程序这些信息系统中的“老员工”——它独特的能力在于推理,而“填表”接口使得它能跟“老员工”很好地配合。
人类文明的进化史,也是信息载体的进化史。在数据世界,Word和记事本在功用上和纸张无异,是“无纸化”进程中的“拆迁户”。而数字化进程,本质是数据的重构和业务的再造,文件会逐渐进化为模型和流程。如果大模型仅仅用于生成内容,那么无异于在上一个时代的信息载体上更快地书写而已。
数字化最大的拦路虎在于落地,用户群体的思想转变速度,始终滞后于设计。而大模型的推理能力,有利于填平这个沟壑,让数字化道路变得平坦。从这个角度来说,大模型的推理能力的意义,或远大于生成能力的意义。超级智能体或许遥远,但在看得到的将来,大模型将在数字空间的各个角落发挥光热。