国际权威榜单放榜:阿里通义千问登顶全球最强开源模型
创始人
2025-03-17 11:12:48

3月17日,国际权威大模型评测榜单LiveBench放榜,阿里巴巴最新开源的推理模型通义千问QwQ-32B冲入全球前五,超过OpenAI-GPT-4.5preview、Google-Gemini2.0、DeepSeek-R1等国内外顶尖模型,成为全球性能最强的开源模型。

LiveBench是由图灵奖得主、Meta 首席 AI 科学家杨立昆(Yann LeCun)领衔发起的大模型评测榜,对大模型的推理、编程、数学、数据分析、语言理解和指令遵循等能力进行综合全面评估。该榜单采用不断更新的实时题库及数据,杜绝了模型提前针对性训练及微调的可能性,是业界公认的最权威、最公正的大模型榜单之一。在最新一期LiveBench 榜单中,全球排名前十的模型仅两款开源,且均来自中国。

千问QwQ-32B开源当天即登顶全球最大的AI社区HuggingFace模型榜榜首,是当下全球最受欢迎的开源大模型。在刷新开源推理模型性能纪录的同时,千问QwQ-32B还大幅降低部署使用成本,让全球先进的中国推理大模型首次在学术界、产业界广泛落地。目前,国家超算互联网平台、广州人工智能公共算力中心以及东南大学、天津大学、山东大学等国内多所985、211高校均接入千问QwQ-32B模型,壁仞科技、摩尔线程、硅基流动、CAMEL-AI、OpenRouter、SambaNova Cloud等海内外企业和平台均推出部署QwQ-32B的算力产品或API服务。

从2023年至今,阿里通义团队已开源200多款模型,囊括文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等「全模态」,覆盖从0.5B到110B等参数「全尺寸」。截至目前,海内外AI开源社区中千问Qwen的衍生模型数量突破10万个,超越美国Meta公司的Llama系列模型,已成为全球第一开源模型。

附链接:https://livebench.ai/#/

相关内容

热门资讯

多点发力!福州机场第二高速公路... 春潮涌动,实干争春。福州机场第二高速公路项目坚持高标准建设、高效率推进,各项工作扎实落地,建设成效持...
援疆风采丨江智信:跳出舒适圈 ... 2024年12月,江智信暂别工作了20多年的福州市永泰县疾病预防控制中心,踏上新疆奇台的土地,开启援...
跨境贸易高水平开放试点扩围至全... 福州新闻网4月14日讯(记者 赖志昌)记者14日从国家外汇管理局福建省分局获悉,为构建“更加便利、更...
见闻|“仙草”生金 畲乡振兴 春日畲乡,万物竞发。在连江县小沧畲族乡东风村,一袋袋菌棒在育种大棚内整齐列队,工人们分工协作、动作娴...