仅仅2小时:摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型
创始人
2025-03-06 20:49:48

快科技3月6日消息,3月6日一早,阿里云正式发布并开源全新推理模型“通义千问QwQ-32B”,而在仅仅2个小时后,摩尔线程就迅速、高效地完成了适配,实现了Day0级支持!

基于大语言模型高速推理框架vLLM、MT Transformer推理引擎部署的QwQ-32B,在摩尔线程GPU上的实际运行中,展现出了卓越的推理性能与稳定性,再次印证了摩尔线程MUSA架构的强大生态兼容性。

值得一提的是,在此之前,摩尔线程仅用一周时间,就火速支持了DeepSeek开源周“全家桶”。

目前,摩尔线程已将这一成果开放上线至模型广场“夸娥工场”。

夸娥工场是摩尔线程倾力打造的模型展示中心,可为用户提供基于摩尔线程夸娥(KUAE)智算集群支持的模型能力体验。

夸娥工场体验地址:

https://playground.mthreads.com

QwQ-32B体验地址:

https://playground.mthreads.com:12019

摩尔线程模型广场“夸娥工场”体验界面

在一系列权威基准测试中,千问QwQ-32B模型表现异常出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1。

尽管它只有32B参数,但通过大规模强化学习训练,其在数学、编程、通用能力等领域实现了显著突破,展现了卓越的智能化水平。

从官方发布的benchmark测试对比图中可以清晰地看到,QwQ-32B在各项测试中成绩显著高于OpenAI-o1-mini、Deepseek的各个蒸馏版本,在LiveBench、BFCL测试中甚至击败了满血版的Deepseek-R1-671B。

相关内容

热门资讯

智能体时代与上海先手棋效应观察 上海这片创新热土上,一场围绕智能体产业的“先手棋”已悄然落子。 今年的政府工作报告提出,深化拓展“人...
三苏祠回应希林娜依·高自罚抄1... 封面新闻记者 罗石芊 李庆3月23日,歌手希林娜依·高在微博发表一张手写100遍“三苏祠”的照片,并...
国城矿业A股股东户数减少835... 3月23日消息,数据显示,截至2026年2月28日,国城矿业(维权)A股股东总户数为2.86万户,较...
伊朗外长与土耳其外长通话,强调... 当地时间3月23日,伊朗外长阿拉格齐同土耳其外长费丹通电话,就地区局势发展及美以伊冲突对地区和全球安...
肖战亮相,NARS在沪全球首发... (来源:上观新闻)NARS在沪全球首发超雾瓶粉底液,梅津利信:中国已成集团全球创新策源地上海前滩·3...