国内大模型重磅升级,带动AI应用加速落地
创始人
2025-08-01 06:10:35
0

(来源:南京晨报)

转自:南京晨报

6月17日,阿里巴巴通义团队开源了全新的千问3量化模型,完成基于苹果硬件的MLX框架的全系模型深度适配。MLX框架是专为苹果芯片优化的机器学习框架,在AI开源社区广受关注。此次千问3一次性推出32个官方MLX量化模型,包含4bit、6bit、8bit 和 BF16 等不同精度,可满足开发者在Mac Studio、Macbook、iPhone等不同苹果硬件上部署大模型的需求。

7月11日,月之暗面发布了开源大模型Kimi K2,引发全球关注,上线一周后,国际权威大模型排行榜LMArena宣布,这一模型接棒DeepSeek,登顶全球开源模型榜单,并在开闭源总榜上排名第五。Kimi K2在多项基准性能测试中取得优异表现,展现出在自主编程、智能体工具调用和数学推理等方面的领先能力,良好的使用体验也让Kimi K2在海外技术社区上收获了大量好评。7月23日,阿里巴巴正式发布了全新开源代码模型 Qwen3-Coder,拥有高达4800亿的总参数量和350亿的激活参数,原生支持256K token的上下文,并可扩展到100万token,支持358种编程语言。Qwen3-Coder采用了混合专家(MoE)模型架构,配备了96个查询(Q)注意力头和8个键/值(KV)注意力头,拥有160个专家,其中8个专家被激活。在预训练阶段,该模型从数据、上下文和合成数据三个角度进行扩展,以提升代码能力;在后训练阶段,研究团队通过在真实代码任务上扩展代码强化学习(Code RL)训练,显著提升了代码执行成功率。

南京证券研究员李栋表示,各地支持人工智能的政策陆续落地。6月4日,据杭州日报报道,《杭州市加快建设人工智能创新高地实施方案(2025年版)》即将出台,该实施方案提出到2025年,全市投入市场的智算规模要超过50EFLOPS;培育具有国际一流水平的基础大模型2个,具有行业重大影响力的垂直应用大模型25个以上;力争全市人工智能核心产业营业收入超3900亿元,规模以上人工智能核心产业企业超700家;全市投向人工智能的产业基金组建规模突破1000亿元。6月24日,郑州市人民政府办公室印发《郑州市场景驱动人工智能创新发展行动方案(2025—2027年)》,其中提出培育大模型产业生态。深化与DeepSeek等人工智能头部企业的合作,引入高质量通用型大模型;支持大模型企业深耕细分领域,聚焦智慧医疗、智能工厂、智慧交通、智慧文旅等重点场景,做精做强一批具有行业竞争力的垂直大模型。

李栋认为AI作为新一轮产业趋势,随着大模型的不断迭代、模型性能的不断提高以及推理成本的不断下降,有望持续赋能到各行各业,目前海外已经在模型层和垂直应用(AI+教育、AI+医疗等)取得商业化进展,国内AI顶层框架持续落地,强化需求牵引,加快重点行业赋能,并涌现出以DeepSeek、通义千问、豆包、kimi为代表的优质大模型,建议投资者重点关注互联网巨头、AIDC、AI电源等环节的投资机会。

风险提示:AI商业化落地不及预期、H20存在断供风险、国产AI芯片进展不及预期等。

(以上内容仅供参考,不作为投资决策依据。投资有风险,入市需谨慎。)

南京晨报/爱南京记者 许崇静

相关内容

热门资讯

筑起抗联将士生存和战斗的生命线 (来源:黑龙江日报)转自:黑龙江日报 烟筒砬子东北抗联密营遗址。本报记者 刘晓云摄 ...
“硬仗将军”王甲本 在云南省曲靖市富源县,“硬仗将军”王甲本的故事家喻户晓。这位从乌蒙山区走出的铁血将领,一生戎马,从云...
日本为什么叫“倭国... 日本为什么叫“倭国”?古代的日本人有多矮?趣历史小编给大家提供详细的相关内容。日本在古时被称为倭国,...
孙权杀关羽后,为何力劝曹操称帝... 孙权杀关羽后,为何力劝曹操称帝?曹操为何又不上套?不清楚的读者可以和趣历史小编一起看下去。东汉末年,...
揭秘:雍正究竟为什么要抄曹雪芹... 揭秘:雍正究竟为什么要抄曹雪芹的家 不清楚的读者可以和趣历史小编一起看下去。雍正六年,雍正皇帝下旨查...