蚂蚁集团开源全模态大模型Ming-Flash-Omni2.0
创始人
2026-02-11 15:19:31

观点网讯:2月11日,蚂蚁集团开源发布全模态大模型Ming-Flash-Omni2.0。该模型是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐,用户通过自然语言即可对音色、语速、语调等参数进行精细控制。

根据公开资料整理,Ming-Flash-Omni2.0实现了3.1Hz的极低推理帧率,可完成分钟级长音频的实时高保真生成,部分性能指标超过Gemini 2.5 Pro,同时其开源属性将降低相关领域的开发复杂度。

免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。

相关内容

热门资讯

设计总监岗位职责 设计总监岗位...   1)负责设计业务的管理、指导,负责与客户协调沟通;分析目标客户需求,充分理解客户意图,正确把握项...
工厂门卫岗位职责 工厂门卫岗位...   1、凡出入本公司人员均须验明身份,通过访客登记管理本进行登记才允许入内。来宾离开时,填写离开时间...
工艺工程师岗位职责 工艺工程师...   1、在工艺副主任的领导下,具体负责本单位的生产及工艺管理工作。配合设备工作的管理和HSE管理。 ...
职工食堂采购员岗位职责 生鲜超...   1、在膳食科长领导下,负责职工食堂的食品、物品采购供应。服从领导分配,及时完成领导交给的各项任务...
仓管员岗位职责 仓管员岗位职责...   1、配合本区域产品的调配工作,负责货品运输途中的安全。   2、按单配货,清理仓库卫生,整理好货...