清华大学与巨人网络联合首创多方言语音合成框架,数据代码方法全开源
创始人
2025-10-15 14:44:23

10月15日消息,巨人网络 AI Lab 与清华大学电子工程系 SATLab 的研究团队联合首创多方言语音合成大模型框架 DiaMoE-TTS ,数据代码方法全开源,借此推动方言语音合成的公平与普惠。

在当今大模型引领的语音合成时代,通用 TTS 系统已展现出令人惊叹的能力,但方言 TTS 依然是相关从业者难以触及的“灰色地带”。现有的工业级模型往往依赖巨量专有数据,这让方言 TTS 从业者和研究者几乎无从下手:缺乏统一的语料构建方法,更缺乏一个可实现多语言的端到端开源框架。

双方联合首创的 DiaMoE-TTS ,这是一个在一定程度上媲美工业级方言 TTS 模型的开源全套解决方案。他们基于语言学家的专业经验,构建了一个统一的 IPA 表达体系,并且在仅依赖开源方言 ASR 数据的前提下提出这一方案。

在推出广东话、四川话、上海话等中文方言版本之前,研究团队已在英语、法语、德语、荷兰比尔茨语等多语种场景中进行过验证,确保该方法具备全球范围内多语言的可扩展性与稳健性。

巨人网络 AI Lab 与清华大学电子工程系 SATLab 希望借此推动方言语音合成的公平与普惠,让任何研究者、开发者乃至语言文化保护工作者都能自由使用、改进与扩展这一框架;让小众语言与方言的声音不再被淹没在通用大模型的洪流中,而能通过开源的力量被更广泛地听见与传承。

相关内容

热门资讯

端午假期首日客流刷新纪录 福州... 6月19日端午假期首日,中国铁路南昌局集团有限公司福州车站(以下简称福州车站)发送旅客188307人...
比AI更猛的王炸产业来了 6月10日,一份重磅文件正式落地——工业和信息化部印发《“人工智能+信息通信”创新发展实施意见(20...
AI本地模型部署AI固态硬盘推... AI本地模型部署新选择:三星9100PRO PCI - E 5.0固态硬盘 在AI时代的浪潮下,我...
内江最新或2023(历届)直接... 强军兴国担大任 热血青春铸辉煌—— 直接招收士官宣传教育提纲 人才是富国强军之本,建设现代化军队离...
成都中医药大学最新或2023(... 根据市、区人民政府最新或2023(历届)直招士官工作安排,现将在我校最新或2023(历届)毕业生中招...