爱建证券-人工智能行业月度跟踪:全球最大参数模型Kimi K2发布-250722
创始人
2025-07-22 20:21:59
0

(来源:研报虎)

  2025年7月11日,月之暗面(Moonshot AI)发布采用MoE架构的大模型Kimi K2,并同步开源。这款模型总参数量达1万亿,每次推理仅激活320亿参数,在代码能力和通用Agent任务处理上表现突出,同时凭借架构优化实现了性能与成本的平衡,输入输出价格更具优势。

  月之暗面由杨植麟于2023年4月创立,聚焦探索能源转化为智能的最优路径,其产品迭代轨迹清晰。2023年10月推出首款智能助手Kimi,以Transformer-XL等算法实现20万汉字输入的长文本处理突破;2024年持续升级,先后实现200万字无损上下文能力、拓展多模态场景及工具调用功能,同年年底发布对标OpenAI o1的k0-math数学模型与k1视觉思考模型;2025年1月推出的k1.5多模态模型,在Long CoT模式下能力达o1水平,Short CoT模式下领先GPT-4o和Claude3.5。2025年7月11日,公司发布KimiK2大模型并同步开源。

   Kimi K2采用64头注意力+384专家MoE设计,相比DeepSeek V3/R1更具效能。这一设计减少了自注意力计算负担,在加快推理速度、提升128K长文本处理效率的同时,扩展了知识覆盖范围和多任务适配性。训练端,借助Muon Clips优化器完成15.5万亿Tokens的高效训练,全程无峰值且持续提升Token利用效率;此外,为解决工具交互数据稀缺问题,它采用大规模Agentic数据合成策略,学习复杂工具调用能力。

   Kimi K2是性能与成本平衡的大规模模型(总参数量达1万亿,每次推理仅激活320亿参数)。其训练成本覆盖算力(如GPU集群)、数据准备、算法调优等核心环节,相较于GPT-4.5、SparkDesk-v1.1、Llama-3.1等模型,Kimi K2通过更精准的参数激活与架构优化控制成本,设计更聚焦实际落地效率。目前Kimi K2输入、输出价格分别为0.6$/Million Tokens、2.5$/Million Tokens。

   Kimi K2在自主编程、工具调用、数学推理等复杂任务上表现突出,应用场景广泛。代码生成速度与软件开发效率显著提升,数学推理与科研计算精度加速研究进程,创意写作质量(文学评测SOTA)更是高居榜首。技术落地推动硬件升级,既拉动高性能GPU/TPU及边缘计算设备的需求与性能跃升,又优化电子供应链、降低中小企业AI应用门槛。

   Kimi K2的发布标志着国产AI在全球竞争中的全新突破。Kimi K2强大的代码能力、Agent任务处理能力和开源策略,为开发者与用户提供了无限可能。无论是科研人员、开发者还是普通用户,都可以通过Kimi K2探索AI的更多潜力。

  风险提示:1)先进算力芯片限制加强2)下游应用需求不及预期3)国产模型迭代升级迟缓

相关内容

热门资讯

湖南一4岁男孩全麻拔乳牙身亡,... (来源:都市现场)7月22日,有网友在社交媒体发布视频,称其四岁侄子在桂阳县第一人民医院(总院)接受...
六合单产“稻”路升级 6.17万亩土地唱响“良田、良种、良法、良机”四重奏六合单产“稻”路升级南报网讯(记者 孙敬清 通讯...
美国3进3出联合国教科文组织 【#美国3进3出联合国教科文组织#】#美国重返教科文组织2年又要退#当地时间22日,美国国务院发言人...
岂容“标书代写”玷污科研生态   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:网易科技)半...
男子用软件抢占某知名博物馆门票... 无论是购买演唱会门票,还是预约博物馆,抢票软件都破坏了公平的票务秩序,多部门也一直在持续加大对抢票软...