阿里巴巴正式开源千问3 仅需4张H20即可部署满血版
创始人
2025-04-29 08:16:03

快科技4月29日消息,今天凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。

千问3是“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。

作为Qwen系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。

在相同计算资源下,Qwen3 模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。

千问3总参数量235B,刷新了开源模型的智能水平新高,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。

相关内容

热门资讯

亚马逊计划在FirePhone...   2014年,亚马逊推出了首款智能手机,希望与苹果和三星一较高下。然而,由创始人杰夫-贝索斯(Je...
省政协召开“双推”协商活动和打...   本报讯 记者陈思伊报道 3月20日,省政协以视频会议形式召开2026年度“双推”协商活动和打造“...
吃干榨尽一块磷 转自:贵州日报贵州磷化集团瓮福化工公司全景。(企业供图) 贵州日报天眼新闻记者 方亚丽3月初,黔南州...
传统矿业向新向智 转自:贵州日报毕节市黔西市青龙煤矿地面原煤生产系统。 贵州日报天眼新闻记者 金秋时 摄 2025年3...
市知识产权保护中心护航企业“出... (来源:沈阳日报)转自:沈阳日报  本报讯(沈阳日报、沈报全媒体记者岳雨)记者3月20日获悉,沈阳市...