(来源:南京晨报)
转自:南京晨报
6月17日,阿里巴巴通义团队开源了全新的千问3量化模型,完成基于苹果硬件的MLX框架的全系模型深度适配。MLX框架是专为苹果芯片优化的机器学习框架,在AI开源社区广受关注。此次千问3一次性推出32个官方MLX量化模型,包含4bit、6bit、8bit 和 BF16 等不同精度,可满足开发者在Mac Studio、Macbook、iPhone等不同苹果硬件上部署大模型的需求。
7月11日,月之暗面发布了开源大模型Kimi K2,引发全球关注,上线一周后,国际权威大模型排行榜LMArena宣布,这一模型接棒DeepSeek,登顶全球开源模型榜单,并在开闭源总榜上排名第五。Kimi K2在多项基准性能测试中取得优异表现,展现出在自主编程、智能体工具调用和数学推理等方面的领先能力,良好的使用体验也让Kimi K2在海外技术社区上收获了大量好评。7月23日,阿里巴巴正式发布了全新开源代码模型 Qwen3-Coder,拥有高达4800亿的总参数量和350亿的激活参数,原生支持256K token的上下文,并可扩展到100万token,支持358种编程语言。Qwen3-Coder采用了混合专家(MoE)模型架构,配备了96个查询(Q)注意力头和8个键/值(KV)注意力头,拥有160个专家,其中8个专家被激活。在预训练阶段,该模型从数据、上下文和合成数据三个角度进行扩展,以提升代码能力;在后训练阶段,研究团队通过在真实代码任务上扩展代码强化学习(Code RL)训练,显著提升了代码执行成功率。
南京证券研究员李栋表示,各地支持人工智能的政策陆续落地。6月4日,据杭州日报报道,《杭州市加快建设人工智能创新高地实施方案(2025年版)》即将出台,该实施方案提出到2025年,全市投入市场的智算规模要超过50EFLOPS;培育具有国际一流水平的基础大模型2个,具有行业重大影响力的垂直应用大模型25个以上;力争全市人工智能核心产业营业收入超3900亿元,规模以上人工智能核心产业企业超700家;全市投向人工智能的产业基金组建规模突破1000亿元。6月24日,郑州市人民政府办公室印发《郑州市场景驱动人工智能创新发展行动方案(2025—2027年)》,其中提出培育大模型产业生态。深化与DeepSeek等人工智能头部企业的合作,引入高质量通用型大模型;支持大模型企业深耕细分领域,聚焦智慧医疗、智能工厂、智慧交通、智慧文旅等重点场景,做精做强一批具有行业竞争力的垂直大模型。
李栋认为AI作为新一轮产业趋势,随着大模型的不断迭代、模型性能的不断提高以及推理成本的不断下降,有望持续赋能到各行各业,目前海外已经在模型层和垂直应用(AI+教育、AI+医疗等)取得商业化进展,国内AI顶层框架持续落地,强化需求牵引,加快重点行业赋能,并涌现出以DeepSeek、通义千问、豆包、kimi为代表的优质大模型,建议投资者重点关注互联网巨头、AIDC、AI电源等环节的投资机会。
风险提示:AI商业化落地不及预期、H20存在断供风险、国产AI芯片进展不及预期等。
(以上内容仅供参考,不作为投资决策依据。投资有风险,入市需谨慎。)
南京晨报/爱南京记者 许崇静