TEN VAD 与 Turn Detection开源,让Voice Agent 对话更拟人
创始人
2025-05-20 15:20:11
0

近日,声网和RTE开发者社区宣布,共同支持TEN VAD 和 TEN Turn Detection两款新模型开源。这两个模型是基于声网十余年实时语音深度研究成果与超低延迟技术积累所打造的高性能模型,能够让 AI Agent 的交互体验更加自然。作为开源项目,任何人都可以自由使用、Fork 或为其贡献代码。这两款模型也将作为开源对话式 AI 生态体系 TEN 的核心模块持续迭代优化。

TEN VAD:超低延迟、低功耗、高准确率的语音活动检测模型

TEN VAD 是一个基于深度学习的轻量级流式语音活动检测模型,具备低延迟、低功耗、高准确率等优势。它通常用于语音输入大语言模型(LLM)前的预处理步骤,准确识别是否音频中包含人声并过滤掉无效音频(例如背景噪音或静音段)。

虽然它的功能简单,但作用十分强大:

· 准确识别音频帧中是否有人声;

· 判断一句话的开始和结束位置;

· 过滤掉无关音频(背景噪音、静音等);

这不仅提升了 STT 的准确性,还能显著降低处理成本--避免将无意义的声音送入到 STT 流程中从而产生费用。同时,如果你会用到“轮次检测(Turn Detection)”,那么 VAD 是你的必选项,它是轮次检测准确性的可靠保障。

性能对比:与目前常用的 WebRTC Pitch VAD 和 Silero VAD 相比,在公开的 TEN VAD 测试集上(来自多场景、逐帧人工标注),TEN VAD 展示出了更优的效果。

在延迟方面 TEN VAD 同样领先。它能快速检测语音与非语音之间的切换,而 Silero VAD 则存在数百毫秒的延迟,导致人机交互系统的端到端延迟和打断延迟增加。

开发者友好:TEN VAD 已在 Hugging Face 和 GitHub 上开源,并附带人工精标的数据集(TEN VAD Test Sample),开发者可以一键使用进行模型推理或模型评估。

实际应用效果:一个真实用户案例显示,使用 TEN VAD 后,音频传输数据量减少了 62%,显著降低了语音服务成本。

TEN Turn Detection:让 Voice Agent 学会“何时说、何时听”

TEN Turn Detection 重在解决人机对话中最难的部分之一——判断用户何时停止说话。在真实交流中,AI 需要区分出“中途停顿”与“说完了”的差别。插话太早会打断人类思路,太迟回应则会显得迟钝、不自然。

TEN Turn Detection 支持全双工语音交互,即允许用户和 AI 同时说话,就像两个人交流时那样自然。

工作原理:它不仅识别语音内容,还通过分析语言模式,判断说话者是在思考、犹豫,还是已经表达完毕;最终让 AI 更智能地决定“该说”还是“该听”,从而让对话更加流畅自然。该模型支持中英文,可供所有 Voice Agent 开发者自由使用。

效果表现:我们在多场景测试数据集上对比了 TEN Turn Detection 和其他同类开源模型,各模型的表现如下:

为什么选择 TEN VAD 和 TEN Turn Detection?

当结合使用这两个模型时可以打造出更自然、反应更迅速、成本更低的 Voice Agent:

开源 + 高质量

· 基于声网十多年实时语音深度研究经验;

· 超低延迟、低功耗、高准确率;

· 完全开源,Apache 2.0 许可证,欢迎使用、修改和贡献。

更自然的对话

· 正确处理“打断”、“停顿”、“回应”等人类式交互;

· 极大提升用户体验。

成本更低

· VAD 准确识别语音帧,有效减少语音识别调用量;

· 实测结果显示:两者合用能大幅降低总系统成本。

即插即用

· 可作为 TEN Framework 的插件模块使用;

· 对于已经使用 TEN Framework 的开发者,支持无缝集成;

· 对于正在选型 AI Agent 框架的团队,TEN 是具备最佳 VAD 和轮次检测能力的选择之一。

使用 TEN VAD 和 TEN Turn Detection 的最佳实践

两款模型都可以搭配 TEN Agent(基于 TEN Framework 的 Voice Agent)使用:

Hugging Face 上快速运行(推荐)

1.登录 Hugging Face;

2.打开 TEN Agent Demo;

相关内容

热门资讯

社交的终极答案:要么做徐志胜,... 内娱显学之一的坞学出新番了。桃花坞新一季开播。踏入五周年的“桃花坞”,今年带来了新的社交问题:社交扩...
靠《哪吒2》大赚后,170亿王... 雷达财经出品文|孟帅编|深海在电影《哪吒之魔童闹海》以雷霆之势席卷超150亿元票房后,靠该片赚得盆满...
《狮城山海》何老才是真正聪明人... 《狮城山海》越来越好看了,我最近天天都在期待这部剧的更新。果然央八出手就是精品哈。随着山海帮前任老大...
藏海“杀”了么第一单,究竟鹿死... 从开播前优酷预约量突破977万,打破平台历史记录,到如今热度破万,刷新优酷改版后最快破万记录,万众期...
这部9.3分的良心美剧,拍得太... 如果你觉得资本只是冷冰冰的数字游戏,那这部剧会让你颤一下。美剧《成瘾剂量》,8集,豆瓣9.3,IMD...
一生一世:520,周生辰时宜的... 文/苏小妹#一生一世如果520有人陪你,那就祝你们双向奔赴;如果没有,那就祝你单向奔赴。可以奔赴美食...
最高9.6分,零差评,这3部神... 如果你以为战争剧只有子弹横飞、英雄光环,那这几部剧能直接颠覆你的想象。今天推荐3部战争题材高分神作,...
迎“十五运”微短剧《开挂吧!我... 5月20日下午广东卫视联合智都集团策划制作的“第十五届全国运动会”主题系列微短剧《开挂吧!我的运动大...
仅播4集央视《护宝寻踪》收视全... 都2002年了,还有人明目张胆地盗墓?故事的刚开始,一伙盗墓贼趁着过年外面放炮仗,趁乱,挖开了墓穴地...
「藏海传」真不错 《藏海传》质量是真不错。故事节奏、人物设定、情节铺垫,都没得说。下限目前看下来是有了,保底7分,就看...
追完大结局,没有遗憾!陈凯西离... 《亲爱的仇敌》24集已经完结,花费25元,一口气看完了点映大结局,全是圆满,没有遗憾!01 罗曼扳回...
陈奕迅“复活”了,但新冠阴影不... 作者|布语最近,陈奕迅因确诊新冠被迫延期在高雄的演唱会,在网上闹得沸沸扬扬,甚至还传出“去世”的谣言...
看完宋威龙新剧《韶华若锦》,不... 在某档综艺节目上,导师郝蕾曾经说过:可以有烂戏,但是烂不到你身上,你才是好演员。言下之意就是,内娱就...
藏海传:看到星斗自毁山庄,才懂... 昨晚看了四集由郑晓龙导演,肖战主演的《藏海传》,感觉整个人都不好了。本名叫蒯稚奴的藏海家原有16口人...
《藏海传》迎头对撞《折腰》,平... 文娱商业观察文/矮子巨人#藏海传破2# #折腰热度破三万# #韶华若锦超前见面会# #宋祖儿刘宇宁折...
肖战&张婧仪主演《藏海传》登陆... 由郑晓龙担任总导演、曹译文担任导演,肖战&张婧仪领衔主演的电视剧《藏海传》登陆东方卫视!5月28日起...
从《折腰》到《藏海传》,古偶“... 齐鲁晚报•齐鲁壹点记者 刘雨涵“双强CP”在当下古偶剧中可谓风头正劲,成为众多作品吸睛揽粉的关键元素...
河北省纪委原副书记、省监委原副... 2025年5月20日,江苏省连云港市中级人民法院一审公开宣判河北省纪委原副书记、省监委原副主任陈玉祥...
他在景德镇“开盲盒”! 独家专访:柴窑艺术家张建。张建柴烧讲究“入窑一色,出窑万彩”,守在窑炉旁,见证作品诞生的人,便是最懂...
陈佳勇:仙鹤神针和其他 我最近对“松弛感”这个词有了更加深刻的理解和体会,主要源自三件事情,也可称为三个片段,它们分别是:塑...