王云杉在《人民日报》撰文指出:词元是人工智能大模型为了高效处理数据,把数据进行拆分后的“最小信息载体”,可以理解为“字/词片段/符号”等。比如“我爱中国!”,可拆分成“我”“爱”“中国”“!”4个词元。如果说互联网时代信息传输的核心度量是“流量”,那么人工智能时代,这一关键指标正变为词元——用户输入的每一个字,模型生成的每一段话、识别的每一幅图像,都在消耗词元。看似很抽象,实际上,每一次词元消耗都对应着真实的场景交互——可能是银行智能客服作出的一笔贷款咨询,是汽车智能座舱处理的一句语音指令,或是编程助手输出的数行复杂代码。词元消耗量爆发式增长,意味着越来越多人工智能应用落地,越来越多个人用户、企业客户在使用智能工具解决问题、提高效率。词元消耗增长与应用落地强绑定的特性,使其成为衡量人工智能产业景气度的重要晴雨表。以长远视角观之,随着我国人工智能产业创新活力的不断释放,词元消耗量的增长不仅具有短期爆发力,还有长期持续性。去年印发的《关于深入实施“人工智能+”行动的意见》强调,“推动人工智能与经济社会各行业各领域广泛深度融合”。比如,人工智能为教育行业提供“长文本知识梳理”,为电商行业提供“多轮智能导购服务”。这些都将为词元调用、消耗提供更丰富、更复杂的场景。