DTS框架让大模型推理准确率提升6%,推理长度缩短23%
创始人
2025-11-21 13:16:36

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:机器之心Pro)

专注推理任务的 Large Reasoning Models 在数学基准上不断取得突破,但也带来了一个重要问题:越想越长、越长越错。本文解读由 JHU、UNC Charlotte 等机构团队的最新工作 DTS(Decoding Tree Sketching):一种即插即用的模型推理框架,依靠高不确定度分支推理和最先完成路径早停两个关键策略,以近似找到最短且正确的推理路径。

在 AIME2024/2025 上,DTS 在 DeepSeek-R1-Distill-Qwen-7B/1.5B 上准确率平均提升 6%、平均推理长度下降约 23%,无尽重复率平均减少 10%。

背景:推理大模型的「过度思考」问题

CoT / 多步推理让模型更会「想」,但也带来很重要的问题:越长越易偏离正确答案或陷入自我重复,正确率反而下降,如下图所示。现有方法多依赖额外训练(SFT/RL)或激进剪枝,落地成本高或稳定性不佳。DTS 开辟了一条全新的技术路线:不训练,只优化解码策略,把「想得又短又准」转变为解码中的搜索问题。

关键实证:最短那条,往往是对的

作者对 AIME24 上的题目做了密集采样:每题 100 次随机解码。结果非常直观:

并且,长度与准确率呈明显负相关:样本点越靠右(越长),正确率越低。这直接催生了 DTS 的目标:以尽可能小的代价,逼近「最短且正确」的那条路径。

Decoding Tree Sketching(稀疏化接码树)

把推理过程看成一棵解码树:节点是已生成 token,路径是一次完整 CoT,叶子节点就是该 CoT 的终止符(指数爆炸的复杂度,因此不可行。DTS 的思路是:只在「关键 token」考虑多种可能的结果从而分支构造树结构,如图所示:

)。寻找最短的推理路径相当于搜索从根节点到最浅层的叶子节点的路径。在这个问题中,穷举搜索可以得到最理想的路径,但是这回造成树分支有

在高熵处产生分支

核心思想:不确定才需要分支;确定时不分支,避免解码树乱枝蔓生。

最先完成即早停

核心思想:把「短即优」的统计规律写进了停止准则。

实验:更准、少复读

QA 准确率提升

DTS 在 AIME2024 和 AIME2025 与传统自回归解码的对比:

结论: 稀疏化解码树 + 早停稳定提升模型最终回答的准确率。

有效抑制模型的「无尽复读」

统计「无法在最大长度内收敛、陷入循环」的比例:

结论:稀疏化解码树 + 早停让「自我复读」的路径被更短的完成路径代替。

一键复现结果

在 Colab 上试运行 DTS: https://colab.research.google.com/github/ZichengXu/Decoding-Tree-Sketching/blob/main/notebooks/example_DeepSeek_R1_Distill_Qwen_1_5B.ipynb

克隆 DTS 的开源项目,并且安装环境:

复现论文中的结果:

结论

DTS 以极低的工程成本,为推理型大模型提供了一种「更聪明」的思考方式。它不依赖后训练,不修改模型参数,仅通过稀疏化的解码树探索最短的推理路径,就能显著提高准确率、减少复读。这种「在不确定处分支、在确定处直行」的设计,使得大模型的推理过程更像人类的理性思考:在模糊时多想几步,在明确时迅速收敛。

DTS 的核心贡献在于:

从更长远的角度看,DTS 展示了一种轻量化的推理优化路线:让模型「想得更少但更准」。未来,类似的解码层优化有望与多步推理、校准与不确定性估计等方向结合,为 Large Reasoning Models 的高效与可靠推理开辟新的路径。

作者介绍

相关内容

热门资讯

潜水手表不能潜水?小米:相关报... (来源:中国宁波网)转自:中国宁波网  11月21日,小米公司发言人对近期网上流传“博主吐槽潜水手表...
大火烧光,车主逃命真难? 来源:中国新闻周刊这些事故是否可以避免?新能源汽车起火,再度引发广泛的公众担忧。10月23日晚,一辆...
俄乌和谈“28点”计划,美俄乌... 转自:北京日报客户端美国白宫新闻秘书卡罗琳·莱维特20日说,美陆军部长德里斯科尔当天在乌克兰首都基辅...
党建共建破解行路难 本网拉萨讯(记者 刘斯宇 通讯员 闫盼盼)近日,那曲市巴青县玛如乡扎贡达村党支部书记带领村民,将一面...
美国分化的非农数据加大12月降... (来源:财闻) 继摩根士丹利后,摩根大通也取消了美联储12月议息会议将降息...