12月15日,阿里通义百聆宣布开源Fun-CosyVoice(0.5B),该版本提供 zero-shot 音色克隆能力,只需3秒录音,就能让你的声音无缝切换语种、方言与情绪,并且还支持本地部署与二次开发。此外,通义百聆还推出了Fun-ASR 的轻量化版本,总参数量压缩到0.8B,新版本推理成本更低,支持本地部署与定制化微调,现已开源。
上一篇:Minion Skills: Claude Skills的开源实现
下一篇:AI御三家年终“火拼”