全国高校首个!东南大学继DeepSeek又上线QwQ-32B
创始人
2025-03-10 09:01:42
0

本文转自【新华日报】;

近日

东大基于昇腾国产算力平台

正式接入阿里最新开源模型QwQ-32B

成为全国首个上线QwQ-32B服务的高校

国产算力基座+头部大模型双轨融合

将为教学科研注入更强的AI动能

QwQ-32B:DeepSeek-R1的超强平替

性能比肩顶级模型

QwQ-32B虽仅有32B参数,但通过大规模强化学习训练,在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)等任务中表现媲美671B参数的DeepSeek-R1,甚至部分指标实现超越。

上图展示了 QwQ-32B 与其他领先模型在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)中的性能对比,QwQ-32B 表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 蒸馏模型。

低成本、易部署

模型支持消费级显卡本地部署,大幅降低硬件门槛,适配昇腾平台的高效算力资源,助力师生在科研中快速实现AI推理需求。

智能体能力革新

集成工具调用与动态推理能力,模型可根据环境反馈调整策略,适用于复杂任务处理,如数据分析、实验模拟等科研场景。

来源:东南大学微信

相关内容

热门资讯

佳先股份拟增资子公司英特美 ... 转自:中国证券报·中证网中证报中证网讯(王珞)佳先股份7月8日晚间披露,为进一步丰富产品种类,拓展光...
上海:支持独角兽企业通过兼并重... 上海市经济信息化委印发《上海市促进高成长企业加快发展三年行动方案(2025-2027年)》。其中提到...
补贴大战不可持续,“三国杀”不... 转自:上观新闻满25减21、零元购奶茶……中国互联网史上最激烈的“外卖大战”7月5日夜间达到顶峰:消...
中国饭店协会:将通过各类活动释... 转自:中工网工人日报-中工网记者 杨召奎7月2日~4日,第六届中国绿色饭店消费季(山东站)在济南雪野...
澳航570万用户数据泄露 经济观察网讯 据央视新闻,当地时间7月9日获悉,澳大利亚澳洲航空公司确认在上周遭受的网络攻击中,有5...