面壁智能VoxCPM 1.5语音生成AI模型开源
创始人
2025-12-10 17:15:30

IT之家 12 月 10 日消息,面壁智能今日官宣,VoxCPM 1.5 版本正式上线,在持续优化开发者开发体验的同时,也带来了多项核心能力升级。

VoxCPM 是一个 0.5B 参数尺寸的语音生成基座模型,于今年 9 月首次发布。

IT之家附 VoxCPM 1.5 更新亮点:

  • 高采样音频克隆:AudioVAE 采样率从 16kHz 提升至 44.1kHz,模型可根据高质量音频,克隆效果更佳、细节更丰富的声音;
  • 生成效率翻倍:在模型参数有所增加的前提下,VoxCPM 1.5 仅需 6.25 个 token 即可生成 1 秒音频,较此前版本提高一倍,在保持速度的同时提升了音频生成质量;
  • 开发者友好:新增 LoRA 和全量微调脚本,支持深度定制;
  • 增强稳定性:减少音频伪影,优化长文本音频的生成效果。

目前,VoxCPM 1.5 模型已在 Github、Hugging Face 开源。

  • Huggingface:https://huggingface.co/openbmb/VoxCPM1.5
  • Github:https://github.com/OpenBMB/VoxCPM

相关内容

热门资讯

警... 引言:在日常的电脑使用中远程木马软件,很多人都会从互联网下载网站或者QQ、微信等聊天软件上下载软件、...
影... 在电脑上编辑视频时,选择一款合适的软件非常重要。有些软件功能多,但操作复杂,让人眼花缭乱;而有些软件...
贝... 写在前面喜欢摆弄远程访问的小伙伴一定对蒲公英这个品牌非常熟悉,其在远程连接领域经过数年的积累,已经形...
原创 华... 华莱士这次摘牌,不是“悄悄换赛道”,而是被现实按在地上反复摩擦。 一个曾经靠“开店速度比你吃汉堡还...
原创 「... 昨日比赛不多没有更新,前日灰熊与步行者的对攻局差一点点,好在是我们两日的重心打包依旧能为我们兜底!明...