炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:正和岛)
在AI界,2024年7月9日是一个不太平凡的日子,有媒体曾把这天形容为中国AI界的“羞辱日”。
为什么这么说呢?因为OpenAI在这天官宣,从即日起将限制不支持地区的API使用,也就是所谓的“停服”,没错,这个不支持的地区中就包含了中国。
这背后的意味可以说再明显不过了——OpenAI将保持闭源策略,以提防其宝贵的模型被中国使用。
但一年之后的今天,相信很多人都会有一个相同的感受,那就是这一风向已发生彻底转变。
例如,几个月前,OpenAI CEO Sam Altman罕见地承认了OpenAI的闭源策略站在了“错误的一边”,同时小心翼翼地放出了有限度“免费+开源”的消息。包括曾专注于闭源模型Gemini的谷歌,几个月前也推出了开源模型Gemma 3,以吸引更多开发者从闭源平台转向开源生态。
以上种种迹象引起了我们的强烈好奇,短短一年时间,AI界怎么就发生了如此之大的风向转变?这背后到底发生了什么?
一番研究下来,我们发现了一个十分关键的原因,那就是中国科技企业所提供的开源模型,有力地替代了美国科技巨头所力推的封闭系统,并让它们感受到了前所未有的压力,不得不做出一定的让步。
这方面,阿里云就是一个典例,甚至可以说,“开源”之所以能够战胜“封闭”,国产模型之所以能够有力抗衡美国AI巨头的遏制,阿里云及背后的阿里是功不可没的。
这并非空口无凭,我们可以简单回顾下:
2024年9月,阿里云推出Qwen2.5系列,包括0.5B到72B等多个尺寸的语言模型、多模态模型、数学模型、代码模型等,一次上架100多个开源模型,刷新业界纪录。
2024年11月28日,阿里云发布全新AI推理模型QwQ-32B-Preview,并同步开源。评测数据显示,QwQ在数学和编程方面表现尤为出色,整体推理水平比肩OpenAI o1。
2024年12月25日,阿里云发布业界首个开源多模态推理模型QVQ-72B-Preview。多项评测数据显示,QVQ超越了此前的视觉理解模型“开源王者”Qwen2-VL,整体表现与“满血版”OpenAI o1、Claude3.5 Sonnet等推理模型相当。
今年3月和4月,阿里云又接连推出全新的开源推理模型通义千问QwQ-32B和Qwen3,极大降低了模型的部署和使用成本,Qwen3更是登顶全球最强开源模型。
在外界看来,如此频繁地推出开源模型,既透露了阿里要将开源进行到底的决心,同时也亮出了其All in“AI+云”的技术底牌。
尤为值得一提的是,就在昨天清晨,阿里云又一“王炸”级开源模型问世——通义千问AI编程大模型Qwen3-Coder。深入了解下来,我们认为,称其为全球最强的编程模型也并不为过。
为什么敢说全球最强?不妨继续往下看。
全球最强,当之无愧!
关于Qwen3-Coder的能力,可以用一句话来形容,超越GPT4.1,比肩全球最强的编程模型Claude4。
如果觉得这句话还不够直白,你也可以这样理解,借助于Qwen3-Coder,一个刚入行的程序员一天就能完成一个资深程序员一周的工作,一个品牌官网仅用5分钟的时间就能生成,乃至一句话就能生成一个3D物理模拟动画。
这里,很多人可能就要问了,这是真的吗?它是怎么实现的?还有哪些让人眼前一亮的地方?结合Qwen3-Coder已公布的信息,我们可以将这些问题的答案梳理为以下几点:
1. 卓越的技术架构框架
从代码模型来看,Qwen3-Coder是千问系列模型中首个采用混合专家MoE架构的代码模型,总参数达480B,激活35B参数。
通俗点来说,我们可以将MoE架构理解为一个各领域专家的集合体。比如,当遇到某个专业问题时,Qwen3-Coder就可以调动该领域的专家进行解决,当遇到一个复杂问题时,它就可以联动各领域的专家来共同解决。
所以,采用MoE架构的Qwen3-Coder可以根据任务类型动态地选择合适的“专家模块”进行处理,模型的任务处理速度和复杂任务的处理能力得到大大提升。
此外,Qwen3-Coder还原生支持256K token的上下文,并可通过技术手段扩展至1M长度。
于编程模型而言,能够理解和记忆多少上下文是衡量其能力的一个硬指标。Qwen3-Coder的这组数据相当于大大扩充了模型的脑容量,让模型的理解力和记忆力得到了极大地提升,能够更好地理清代码之间的逻辑关系,避免“短视”问题。
还有,Qwen3-Coder在代码占比70%的7.5T数据上预训练,庞大且专业的数据量为模型通用能力、代码能力和Agent能力的提升奠定了坚实的基础。
评测结果显示,在浏览器调用(WebArena)、工具调用(BFCL)等Agent能力评测中,Qwen3-Coder刷新开源模型纪录,超越GPT4.1。在考察模型自主规划解决编程任务的SWE-Bench评测中,Qwen3-Coder取得了开源最佳效果,可媲美Claude4。
2. Agent能力取得重大突破
出色的Agent能力也是Qwen3-Coder的一大亮点,它不只能用来写代码,还可以自主规划工作流程并调用工具来解决多步骤的复杂任务。实测数据显示,在执行任务时,Qwen3-Coder能够调用的工具数量比Claude多出几倍,效果非常出色。
此外,从阿里云百炼平台公布的价格来看,Qwen3-Coder的API远比Claude4便宜。以约200K输入为例,Claude 4输入价格为21.48元/百万Tokens,输出价格约107.41元/百万Tokens,而Qwen3-Coder输入为5元/百万Tokens,输出价格为21.48元/百万Tokens,分别为Claude4的1/4和1/5。
所以,有业内人士就指出,开源的Qwen3-Coder有望取代昂贵的Claude,成为Agent领域最受欢迎的编程模型。
3. 程序员的“福音”
于广大程序员而言,Qwen3-Coder无疑是一个“福音”般的存在。
Qwen3-Coder不但可以写代码、补全代码、修Bug,还可以将代码测试、查询生成等工作从人工编写的数小时骤降至数分钟,极大提升了程序员的工作效率。
当程序员们不用再一行行盯着代码找bug,不用再一遍遍地做代码测试和优化,他们就可以从基础的编程工作中解脱出来,将更多的精力放在系统架构和业务逻辑梳理等更高维度的工作上,人的创造力得以进一步发挥。
多说一句,其实不只是程序员,Qwen3-Coder的出现其实也大大降低了普通人接触编程的门槛。试想,只要用一句话来描述自己的想法,比如制作一个赛车小游戏,Qwen3-Coder就能生成相应的游戏代码,这样的编程方式显然不存在任何难度。
4. 开源、开源、还是开源
目前,Qwen3-Coder已在魔搭社区、HuggingFace等平台开源,全球开发者都可以免费下载使用。最新消息显示,Qwen3-Coder很快将接入阿里的AI编程产品通义灵码,API也已上线阿里云百炼。
此外,为方便开发者更好地使用Qwen3-Coder,通义团队还同步开源了一款命令行工具Qwen Code,可以利用其充分发挥Qwen3-Coder在代理式编程上的潜力。
总结下来,Qwen3-Coder可谓集卓越性能、实用价值、社会价值于一身,称其为全球最好的编程模型自然当之无愧!
一场连锁反应或将发生
更深层来看,Qwen3-Coder发布所带来的变革绝不仅仅局限在编程领域,它很可能还会引起一场AI Agent的连锁反应,乃至重构千行百业。
不要忘了,AI之所以能够与物理世界产生交互,之所以能够应用到各行各业,这一切都有赖于编程技术,或者说,编程技术才是那个支撑AI落地的底座所在。当这个底座发生重大变化时,具体的AI应用势必也会随之发生改变。
目前可以预见的是,当Qwen3-Coder极大提升编程效率后,那些能够与AI产生联系的行业,其生产力将得到巨大释放,行业面貌或将焕然一新。
比如医疗行业,过去这些年,医疗行业积累了海量的数据,像病历、影像、检验报告等等,这些数据中其实蕴藏着巨大的医学价值。
过去,受制于有限的技术条件,这些数据无法得以充分挖掘,但如果借助于Qwen3-Coder的模型能力,有理由相信,医疗行业的海量数据(维权)将会被精准、快速地分析,进而为医生提供辅助诊断建议,让疾病的诊断变得更加精确。
比如金融行业,长期以来金融行业以风险和不确定性著称,但如果建立起一个能够对市场行情、交易数据、宏观经济指标等数据实时分析的风险预测模型,并制定相应的风险应对方案,行业中的风险和不确定性很可能就会大大降低。
如果要建立这样一个金融行业的风险预测模型,很显然,Qwen3-Coder在这个过程中将大有可为。
再比如教育行业,当Qwen3-Coder深度应用到教学场景后,智能教学系统会更加全面地掌握每个学生的学习情况、学习进度和知识熟练程度等信息,进而为学生提供个性化的学习方案,传统“一刀切”的教学模式将被大大改变。
所以,表面上看,Qwen3-Coder大大提升了编程效率,可能会引发一场编程革命。但深层来讲,它很可能会引起一个又一个行业变革,且这些行业变革将在Qwen3-Coder的助力下朝着更好地满足市场和用户需求的方向演进。
从这个角度来看,Qwen3-Coder的想象空间和未来前景可以说是无限大的。
结语
最后想说的一点是,在这场愈演愈烈的全球AI竞赛中,Qwen3-Coder的重磅发布,不仅是中国科技企业技术实力的有力证明,更彰显了中国科技企业在这场竞争中的韧性、格局与担当。
韧性无需多言,面对美国科技巨头的技术封锁,一大批中国科技企业以其独特的智慧和创新力突出重围,乃至愈发呈现出赶超之势,这一点阿里等科技企业的领先产品就是最好的回应。
那份格局与担当则更为人称道。例如,当美国科技巨头想着靠闭源来垄断AI进步的路径时,中国科技企业的眼光显然更长远、更务实、更具普世性。
如阿里般,一直以来它想的都是尽可能地通过开源来降低模型训练成本,让模型真正能够低成本的部署和使用,进而让AI技术成为驱动千行百业、惠及千家万户的“共同财富”。
一切,也正如马云所言:
“高科技绝不仅是征服星辰大海,更应该呵护人间烟火。科技人员的责任,不是让AI取代人类,而是让AI更懂人类、更好地服务人类。”
这次Qwen3-Coder的发布也让我们更加相信,中国科技企业不仅无惧封锁与打压,还将以更加开放和创新的姿态,为全球AI发展提供更具包容性的“中国方案”。
至此,必须要说一句,阿里AI,好样的!
排版 | 正风
编辑 | 正风 主编 | 孙允广