家中的宠物猫“喵喵”地叫起来,它在“说”什么?随着人工智能等技术的应用,科研人员正努力实现跨越物种的“翻译”需求,推出好用的“猫语狗语翻译器”,让养宠人更好地“听懂”宠物的想法和情绪。
调查
宠物“情感消费”势头正旺
今年29岁的小袁,和宠物相伴已超过20年。“我小时候,家里收养了一只流浪狗,我人生中的很多重要时刻,都有它在场。”
来到北京工作后,小袁收养了一只小猫,为它取名“铁柱”。经过几年的相处,小袁和“铁柱”已经成为朝夕相伴的“家人”,很有默契。不过有时候,她也会苦恼:“‘铁柱’有时候冲我喵喵叫,我只能猜它到底想要什么,没法判断得特别准确。这种时候要是有个翻译器,能听懂它到底想表达什么就好了。”
记者在主流电商平台搜索发现,用于翻译“猫语狗语”的软硬件产品数量不少,从价格仅几元的翻译软件,到数百元的“智能项圈”等集成硬件均有覆盖。有的买家说“出差时也能远程和猫咪对话”,给出了好评;也有商家在页面注明,“该功能仅供娱乐,主人的陪伴是宝贝们最想要的”。
宠物消费市场统计数据,展示了当前宠物经济“情感消费”的突出属性。一家电商平台发布的《2025三大养宠趋势关键词》显示,宠物语言翻译器成交金额同比增长近740%,呈现爆发式增长态势,直接反映了年轻消费者对智能宠物设备的强烈需求;另一家电商平台统计的《2025宠物行业消费趋势报告》也提出,61.5%的用户愿意为宠物的“情绪健康”付费,智能设备成为养宠刚需。
如今,利用科技手段增强与宠物的情感互动,成为不少养宠人的选择。 28岁的小蕊,家中“猫狗双全”。有时,她会使用一款能够“翻译”猫语狗语的软件,隔空呼唤自家宠物,或是招呼它们开饭,“这些简单的指令,我家宠物能‘听懂’并很好地执行。”
利用人工智能“翻译”动物语言的相关产品,近几年陆续上市。早在2024年,由华人团队研发的全球首个人宠语言互译人工智能原生应用Traini,就探索实现人犬交流,上传宠物狗的叫声、图片和视频后,软件可分析出它12种情绪及衍生的行为表现。2025年,谷歌推出一款大模型,让人类“听懂”海豚的语言,实现人与海豚在水下的实时交流。
探索
猫狗的情绪能被“算”出来
北京市科技企业声智科技也尝试投身这一领域。声智科技副总裁黄赟贺说,宠物翻译产品不仅能满足市场需求,更是技术探索的试验田,“我们希望这个产品能为众多养宠人士带来一些情绪价值,但从产品开发的角度讲还是很严肃的,我们有自己的研究体系。”黄赟贺介绍,作为探索声学与人工智能技术融合的企业,他们详细拆解了翻译器背后的技术原理——通过对猫、狗等宠物声音信号进行特征提取,判断它的意图,推出了面向“猫语”和“狗语”的翻译器。
每一段“喵”“汪”的叫声,都能被具象为一系列声学特征数据。频率、节奏、反映发声特征差异的音色……在系统中,每份声音样本数据都会在人工智能算法的帮助下得到拆解,并被计算出声音中蕴含的情绪或意图。
当前,在分析叫声中蕴含的情绪方面,这类翻译器已经取得技术突破。“针对猫狗叫声的情绪判断及反馈内容识别,目前全球相关研究领域的准确性大概在70%至80%,我们的产品也与之相当。”黄赟贺说,国际同类产品利用预训练声学模型解码狗叫声的情感与意图,准确率稳定在70%左右;针对特定高频情绪,行业领先水平已能触达80%以上。
开心、兴奋、低落、生气等情绪,在宠物叫声中,都会反映为不同的声音频率、振幅等特点。但黄赟贺坦言,要通过声音理解它们的意图,仍面临较大挑战。例如“我想吃饭”“我要睡觉”等意图的表达,需要综合更全面的因素进行分析。同时,科研团队也需要提供更多、更精准的数据样本,人工智能才能开展更深入的学习。
动物的声音表达存在高度个体化和情境依赖等特点。“宠物个体之间差异很大,基于现有数据库资源,我们能实现的‘翻译’,主要停留在情感的映射分析,暂时还无法达到语义理解的程度。”黄赟贺家里有一只猫,她在给小猫试用翻译器时,发现有效的反应主要集中在呼唤、表达开心等基础行为。“当然,开发这项产品也不仅是为了服务人,更是为了让人工智能对世界的理解更全面,为它加入听觉这个认知的新维度。”黄赟贺从更广阔的科技发展视角看待这类产品,相关技术的研发,能不断完善声学世界模型,实现通过声音变化预测事件走向的目标。
黄赟贺说,有朝一日,机器人可能成为家庭保姆,“当它们走进家庭时,不仅要能与人类互动,也要能够读懂作为家庭成员的猫、狗等宠物的情绪状态,最终让这些变量都成为机器人理解世界的一部分。”
解读
人与宠物情感交流胜过“语言”
“动物的交流系统跟人类的语言系统完全不在一个量级。”中国农业大学动物医学院兽医师唐娜长期和各类动物打交道,她解释说,猫、狗是典型的伴侣动物,它们的发声系统,很大程度上是仅为人类而设的。人类可以通过创造词句来表达更为复杂的意思,动物一般是通过相对固定意义的信号,去表达较为固定的意图。“我们可以发现,即使是居住在同一个空间里的猫和狗,它们也不需要通过‘喵喵汪汪’交流,发声主要还是为了吸引主人的注意。”
以猫为例,猫可以发出两三百种不同的“喵”叫声。但唐娜表示,这些声音并不是分别代表某种意思,叫声只是猫与主人的互动方式。它们会通过探索发现,什么样的声音能让人类“听懂”,实现它们想达到的目的。
事实上,在动物交流过程中,声音系统的影响占比并不大,肢体语言其实更为重要。唐娜举例说,比如两只猫在墙头相向而行,一只猫甩了甩尾巴,另一只猫眯了眯眼睛,然后各自走开。在人类看来,它们之间没有“说话”,似乎没有发生交流,然而在动物世界中,它们已经通过面部表情、胡须、身体姿态等,表明了各自的态度。
更有趣的是,猫和狗之间的信号系统可能存在矛盾。“不同物种的表意信号体系是完全不一样的,甚至有一些表达会完全相反。”唐娜说,“例如摇尾巴,对于狗来说是兴奋的表现,但猫甩尾巴则表示烦躁;狗往前扑是想要接近你,猫往前扑却是‘走开’的意思。”
人与宠物的互动,更多依靠“读懂”情绪,而不是“听懂”。“人与宠物之间的信息流动,并不要求某一方必须完全理解对方发出的声音含义。”唐娜在接诊时,往往短时间内就能获得陌生动物的信任。她介绍,动物进入陌生环境后,需要慢慢熟悉,“我们人类常常会主动表达热情,但其实宠物主人的情绪越平静、越放松,越能够消除宠物的焦虑。”
虽然猫语狗语翻译器的技术目前仍存在局限,但这类产品依然受到不少宠物主人的欢迎。在唐娜看来,这类翻译器的价值在于响应用户的情感需求。“人和猫狗等宠物之间的交流是最宝贵的,但这种交流并不一定局限于‘言语’,更重要的是其中的情感流动。”本报记者 刘苏雅
链接
“解码”自然新方法
对猫狗等动物叫声的研究,可被归类至生物声学范畴。生物声学是研究动物声音产生、传播和接收的生物物理学分支学科。在该领域,利用人工智能技术建立的生物声学世界模型,可以通过强化学习、深度学习等方法,实现对声音的“计算”,并从复杂的声学数据中识别出模式和趋势,为生物多样性的长期监测和研究提供支持。目前,除了将猫狗等宠物作为研究对象,鸟类、鲸豚、蝙蝠等物种的声音数据库也正在建立完善,有望成为人类“解码”自然的新方法。