DTS框架让大模型推理准确率提升6%，推理长度缩短23%_热点

DTS框架让大模型推理准确率提升6%，推理长度缩短23%

创始人

2025-11-21 13:16:36

　　炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

（来源：机器之心Pro）

专注推理任务的 Large Reasoning Models 在数学基准上不断取得突破，但也带来了一个重要问题：越想越长、越长越错。本文解读由 JHU、UNC Charlotte 等机构团队的最新工作 DTS（Decoding Tree Sketching）：一种即插即用的模型推理框架，依靠高不确定度分支推理和最先完成路径早停两个关键策略，以近似找到最短且正确的推理路径。

在 AIME2024/2025 上，DTS 在 DeepSeek-R1-Distill-Qwen-7B/1.5B 上准确率平均提升 6%、平均推理长度下降约 23%，无尽重复率平均减少 10%。

背景：推理大模型的「过度思考」问题

CoT / 多步推理让模型更会「想」，但也带来很重要的问题：越长越易偏离正确答案或陷入自我重复，正确率反而下降，如下图所示。现有方法多依赖额外训练（SFT/RL）或激进剪枝，落地成本高或稳定性不佳。DTS 开辟了一条全新的技术路线：不训练，只优化解码策略，把「想得又短又准」转变为解码中的搜索问题。

关键实证：最短那条，往往是对的

作者对 AIME24 上的题目做了密集采样：每题 100 次随机解码。结果非常直观：

并且，长度与准确率呈明显负相关：样本点越靠右（越长），正确率越低。这直接催生了 DTS 的目标：以尽可能小的代价，逼近「最短且正确」的那条路径。

Decoding Tree Sketching（稀疏化接码树）

把推理过程看成一棵解码树：节点是已生成 token，路径是一次完整 CoT，叶子节点就是该 CoT 的终止符（指数爆炸的复杂度，因此不可行。DTS 的思路是：只在「关键 token」考虑多种可能的结果从而分支构造树结构，如图所示：

）。寻找最短的推理路径相当于搜索从根节点到最浅层的叶子节点的路径。在这个问题中，穷举搜索可以得到最理想的路径，但是这回造成树分支有

在高熵处产生分支

核心思想：不确定才需要分支；确定时不分支，避免解码树乱枝蔓生。

最先完成即早停

核心思想：把「短即优」的统计规律写进了停止准则。

实验：更准、少复读

QA 准确率提升

DTS 在 AIME2024 和 AIME2025 与传统自回归解码的对比：

结论：稀疏化解码树 + 早停稳定提升模型最终回答的准确率。

有效抑制模型的「无尽复读」

统计「无法在最大长度内收敛、陷入循环」的比例：

结论：稀疏化解码树 + 早停让「自我复读」的路径被更短的完成路径代替。

一键复现结果

在 Colab 上试运行 DTS: https://colab.research.google.com/github/ZichengXu/Decoding-Tree-Sketching/blob/main/notebooks/example_DeepSeek_R1_Distill_Qwen_1_5B.ipynb

克隆 DTS 的开源项目，并且安装环境：

复现论文中的结果：

结论

DTS 以极低的工程成本，为推理型大模型提供了一种「更聪明」的思考方式。它不依赖后训练，不修改模型参数，仅通过稀疏化的解码树探索最短的推理路径，就能显著提高准确率、减少复读。这种「在不确定处分支、在确定处直行」的设计，使得大模型的推理过程更像人类的理性思考：在模糊时多想几步，在明确时迅速收敛。

DTS 的核心贡献在于：

从更长远的角度看，DTS 展示了一种轻量化的推理优化路线：让模型「想得更少但更准」。未来，类似的解码层优化有望与多步推理、校准与不确定性估计等方向结合，为 Large Reasoning Models 的高效与可靠推理开辟新的路径。

作者介绍

上一篇：警方回应“西安一男子在马路上滑轮滑”：接到举报，正在找人

下一篇：长盈精密股价涨5.64%，天弘基金旗下1只基金重仓，持有4.32万股浮盈赚取7.69万元

DTS框架让大模型推理准确率提升6%，推理长度缩短23%

相关内容

热门资讯