登顶全球最大的AI开源社区!
创始人
2025-03-07 14:22:20
0

本文自南方都市报。

采写 | 南都记者 林文琪

阿里再度推进开源进程。3月6日,阿里凌晨发布并开源通义千问推理模型QwQ-32B。据悉,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,用更小参数实现整体性能比肩DeepSeek-R1,并突破性地让高性能推理模型在消费级显卡上实现本地部署,大幅降低了模型应用成本。随后,千问推理模型QwQ-32B迅速登顶全球最大的AI开源社区Hugging Face大模型榜单。

据悉,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。同时,阿里还开展了大规模强化学习。“在初始阶段,特别针对数学和编程任务进行了大规模强化学习训练。与依赖传统的奖励模型(reward model)不同,我们通过校验生成答案的正确性来为数学问题提供反馈,并通过代码执行服务器评估生成的代码是否成功通过测试用例来提供代码的反馈。”通义千问团队称。

最近,针对开源阿里方面动作频频。就在2月25日晚,阿里云深夜抢先开源旗下视觉生成基座模型万相2.1(Wan)。阿里云该开源产品采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,在权威测评中,万相2.1也已经超越了Sora、Luma、Pika等国内外模型。

另外在2月25日日间,阿里Qwen团队在社交媒体宣布发布新推理模型——深度思考(QwQ)。据介绍,该新推理模型基于Qwen2.5-Max的推理模型,目前的模型为预览版,已具有很强的数学理解、编码、代理等能力,目前支持有深度思考(QWQ)和联网搜索,同时布局了多模态能力,能根据提示语句生成图片。

自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2等多代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。根据全球最大AI开源社区Hugging Face信息,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破10万。

相关内容

热门资讯

又改口了,特朗普:不会赦免农场... 来源:央视新闻客户端 △当地时间8日,特朗普在内阁会议上讲话(图源:美国广播公司)当地时间7月8日,...
吉林亚泰(集团)股份有限公司2... 证券代码:600881 证券简称:亚泰集团 公告编号:临2025-073号吉林亚泰(集团)股份有限...
最新或2023(历届)广西高考... 总的说来,在贯彻落实《国务院关于深化考试招生制度改革的实施意见》的开局之年,最新或2023(历届)高...
最新或2023(历届)吉林高考... 、试卷总述:  从今年的试卷来看,试卷考查的知识点和去年相比变化不大,延续前几年的考察思路,以基础知...
最新或2023(历届)海南高考... 南海网海口6月7日消息(南海网记者 刘麦)最新或2023(历届)海南高考数学科目的考试结束,很多同学...