仅仅2小时：摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型_知识

创始人

2025-03-06 20:49:48

快科技3月6日消息，3月6日一早，阿里云正式发布并开源全新推理模型“通义千问QwQ-32B”，而在仅仅2个小时后，摩尔线程就迅速、高效地完成了适配，实现了Day0级支持！

基于大语言模型高速推理框架vLLM、MT Transformer推理引擎部署的QwQ-32B，在摩尔线程GPU上的实际运行中，展现出了卓越的推理性能与稳定性，再次印证了摩尔线程MUSA架构的强大生态兼容性。

值得一提的是，在此之前，摩尔线程仅用一周时间，就火速支持了DeepSeek开源周“全家桶”。

目前，摩尔线程已将这一成果开放上线至模型广场“夸娥工场”。

夸娥工场是摩尔线程倾力打造的模型展示中心，可为用户提供基于摩尔线程夸娥（KUAE）智算集群支持的模型能力体验。

夸娥工场体验地址：

https://playground.mthreads.com

QwQ-32B体验地址：

https://playground.mthreads.com:12019

摩尔线程模型广场“夸娥工场”体验界面

在一系列权威基准测试中，千问QwQ-32B模型表现异常出色，几乎完全超越了OpenAI-o1-mini，比肩最强开源推理模型DeepSeek-R1。

尽管它只有32B参数，但通过大规模强化学习训练，其在数学、编程、通用能力等领域实现了显著突破，展现了卓越的智能化水平。

从官方发布的benchmark测试对比图中可以清晰地看到，QwQ-32B在各项测试中成绩显著高于OpenAI-o1-mini、Deepseek的各个蒸馏版本，在LiveBench、BFCL测试中甚至击败了满血版的Deepseek-R1-671B。