阿里巴巴正式开源千问3 仅需4张H20即可部署满血版
创始人
2025-04-29 08:16:03
0

快科技4月29日消息,今天凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。

千问3是“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。

作为Qwen系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。

在相同计算资源下,Qwen3 模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。

千问3总参数量235B,刷新了开源模型的智能水平新高,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。

相关内容

热门资讯

“特”别的创新 本报记者 徐建华  北京市丰台区方庄芳群园二区20号楼的6部电梯运行时间都已经超过15年,属于老旧电...
山西织密维权网络持续优化消费环...   本报讯(记者 秦海峰)从山西省政府新闻办公室6月25日举行的新闻发布会上获悉,山西省市场监管部门...
中银绒业应当尽快更名 益智  浙江大学公共政策研究院研究员浙江财经大学金融学教授、博士生导师  中银绒业自破产重整剥离羊绒...
“东升西降”格局演变下的挑战与... ■本报记者 张璐璇 上海报道嘉宾简介黄文涛  经济学博士,纽约州立大学访问学者。现任中信建投证券首席...
最新或2023(历届)南京工业... 最新或2023(历届)南京工业大学浦江学院军训时间尚未公布,以下是该校军训注意事项:一、军训前,大家...