7月27日,在2025年世界人工智能大会(WAIC)的“从通用智力到专业生产力:高阶程序引领的AI应用新范式”论坛上,蚂蚁集团旗下蚂蚁密算宣布对外开源高阶程序(High-Order Program)大模型可信应用技术框架,推动解决大模型在专业应用中的可靠性困境,加速大模型在专业领域的规模化应用。据悉,此次开源的是全国首个高阶程序大模型可信应用技术框架。
论坛上,浙江大学教授、区块链与数据安全全国重点实验室主任陈纯表示,大模型的专业化应用,首当其冲面临挑战的是可靠性问题。尽管当前最顶尖的技术水平已经能达到80%到90%的准确率,但其可靠性距离医疗、工业、金融等专业场景的要求仍有显著差距。陈纯说,有人将这一问题简单归结为“幻觉”,但他认为,“幻觉”是智力的必然代价。若消除所有“幻觉”,大模型将退化为机械的检索工具。因此,可靠性的突破不在于消灭“智力特征”,而在于构建工程化保障框架。
蚂蚁密算董事长韦韬认为,要突破大模型在专业化应用中的可靠性困境,技术上不应当只依赖于大模型“十全十美”不犯错,而是通过智能体系和工程体系的结合,实现专业应用可靠性的保障。正如每个人作为个体,是容易犯错、容易有幻觉的,但人类几千年以来不断在工程体系上的进步,能够在易错的个体之上构建庞大而可靠的工程体系,完成诸如登月、探访火星等巨型任务。他提出,通过全新的程序表达、场景知识嵌入和闭环核验反馈机制,可以将大模型不确定的智力输出转化为可信的专业生产力。
对此,蚂蚁密算正在探索高阶程序(High-Order Program)大模型可信应用技术框架。该框架借鉴了人类在工程管理体系中的成功经验,如通过标准作业程序和检查清单等机制,构建一个能够有效复用、验证、扩展和派生的机制,使大模型在应用过程中即使出现幻觉问题,也能保证大模型达到专业领域所需的精确性和可靠性。目前,高阶程序技术框架已经在金融风控全链路、网络入侵检测、医疗重复计费等多行业场景中初步应用,在可靠性和时效性上有显著提升。
韦韬表示,高阶程序可以与大模型强互补,将大模型这样的通用智力引擎,可靠地应用于众多专业场景。“大模型可靠性的解法,不在于大模型本身,而在于工程化和智能化的融合。我们也相信,解决了可靠性问题,大模型即将涌现新的Killer App(杀手级应用)。”
来源:北京日报客户端
记者:孙奇茹