人机语言交互如何更有温度
创始人
2025-07-17 04:56:28
0

(来源:光明日报)

转自:光明日报

    光明图片/视觉中国

    5月22日,参观大阪世博会中国馆的游客使用交互屏。新华社发

    光明图片/视觉中国

当前,全球科技领域正掀起一场人机交互革命,多国科研力量正致力于让人工智能(AI)突破传统功能局限,赋予机器人情感识别与共情能力。在情感计算领域,2024年哥伦比亚大学华人学者开发的Emo机器人实现了微笑预判与实时模仿;日本软银集团于2021年推出的Pepper 6.0改进版,实现了更自然的拟人化交互,通过触觉传感器感知握手力度,或根据环境光线调整瞳孔焦距;2024年发布的搭载美国开放人工智能研究中心(OpenAI)多模态大模型的通用型人形机器人Figure 01可理解模糊指令(如接收到“我饿了”信号后自动递苹果),并依据人类表情调整动作节奏。

  然而,人机交互技术发展仍面临众多深层挑战:现有系统对情感语境的解析浮于表面,无法领会潜台词;反馈机制存在模板化倾向,欠缺个体适配性;跨文化交互中易触发认知偏差。最根本的是,这一技术尚无法实现价值观层面的心灵共鸣。奇点大学创始人兼校长、谷歌技术总监雷·库兹韦尔认为,“人机交互的未来,将是机器人以更加人性化的方式融入我们的日常生活,成为我们不可或缺的伙伴”。

  人机语言交互的“温度”,其核心在于能否实现情感共鸣、文化适配与价值传递。语言不仅是信息符号,更是心灵沟通的桥梁。为冰冷的代码注入人文温度,需在技术突破与设计理念上双轨并进。

情感的“冰封”有待突破

  要想实现有温度的人机交互,关键在于以心弦共振替代机械应答。推动多模态情感识别技术发展,让AI不仅能“听懂”话,更能“看懂”表情、“听出”语气中的情绪波澜。生成技术需突破“机械感”,探索融合语气词、节奏变化、个性化的表达方式。实现这一目标仍面临三重挑战:

  一是语境之冰。古琴曲《流水》未尽的余韵,以及诗文的留白处恰恰是情意的流转之处,扣人心弦。在语言中,“有点冷”的暗示在人类日常语言交互中往往指空调调节指令,“改天聚聚”的客套话往往被解读为日常邀约。但AI系统囿于字面含义,难解语言的弦外之音。

  二是共情之障。用户痛诉宠物离世,AI却推送宠物食品广告;顾客排队扫码缴费,满屏的优惠推送链接接踵而来;老人求助手机操作,密密麻麻的术语及抽象介绍更添惶惑。缺乏情感共鸣的算法,如同盲人抚琴,纵有良材妙计,终难奏温暖之音。

  三是文化之壑。向中东用户发送举杯表情触动宗教禁忌;对日本用户使用直白否定违背谦和传统;向穆斯林用户推荐猪肉制品礼盒造成品牌危机;中文用户的一句“下次再约”可能是委婉拒绝,而西方英文AI可能将其理解为“积极邀约”。当技术忽视文明基因的多样性,人机对话便如同来自不同文化领域的异乡人执手相望,眼底尽是不解和误读的迷雾。

将文明薪火熔铸于算法内核

  技术发展须与人类情感伦理同频共振。想要机器人具备情感识别与共情能力,需要让技术学会“感同身受”,让硅基智慧长出人性的根系。系统需深入理解不同文化背景下的语言习惯与表达偏好,避免文化误读带来的冰冷感。同时,基于用户画像与历史交互,提供更贴合个体风格的回应。AI的发展不能仅是在代码表面贴上人文“创可贴”,而是要将‌文明密码编译进技术DNA的深层。

  以情感计算破茧。2024年5月,OpenAI推出的生成式AI模型GPT-4o是首个集成了文本、视觉和音频处理的模型,其突破性不仅体现在技术指标的跃升,更在于对人类情感需求的细腻回应。该模型突破性实现了跨模态情绪融合,既能识别用户的紧张情绪并给予指导,还能根据需求调整语调,展现出高度的情境适应性。当摄像头感知到用户紧抿的嘴唇,语音系统能迅速关联语音语调的细微颤抖,并结合对话语境自动切换温和抚慰模式,以共情式回应化解焦虑,为构建更有温度的智慧社会提供全新范式。

  促进神经网络的文化觉醒。2023年9月正式发布的生成式AI辅助解决方案IBM Watson Assistant,在跨文化交互领域的创新实践中展示了其文化智慧。面对巴西用户的抱怨,IBM Watson Assistant没有提供刻板的故障代码解释,而是在回应中融入桑巴舞的灵动比喻,这种将技术问题转化为文化共鸣的智慧,既消解了用户焦虑,更传递出品牌对本土文化的尊重。该大语言模型的海量多语种、多文化语料训练,形成了‌隐性的“文化知识图谱”‌,使机器具备初步的文化模式识别能力。系统不仅识别表层文化特征(如语言),更能‌理解文化行为背后的逻辑与情感动因。

  校准人工智能的伦理价值。如今,在约旦扎塔里难民营中,一场静默的科技革命正在抚平战争创伤。面对创伤倾诉,屏幕另一端的AI辅导员没有急于填充对话的空白,而是将相应延迟设定为人类呼吸时长的3.8秒,将输出模板固定为具有情感的句式。这得益于目前‌约旦扎塔里难民营使用的AI技术,主要包括语音识别技术和动态时间规整算法。工程师发现帐篷帆布会影响麦克风收声,于是开发出降噪算法,专门过滤风吹帆布的哗啦声。针对文盲率超40%的群体,界面图标用图画代替文字,如水滴代表饮水需求,十字代表医疗求助。语音转写功能甚至能识别带着哭泣的叙述,把抽噎间的关键词自动高亮。这些数据被科技转化为独特算法,使AI的回应节奏与人类潜意识完美共振。

让机器与人类产生共鸣

  人机关系的核心本质是理解、共情、协同进化。共生的目标不是创造拥有“人类心灵”的机器,而是让机器能够深刻理解人类的真实想法,并直击心灵深处。机器与人类产生共鸣,其本质是情感的双向流动,让机器成为真正的人类智能伙伴。真正的共生需要人类放下优越感,向机器传递文明基因,进而让机器反哺人类并与人类和平共处。我们传递的不仅是技术,更是培养机器理解何为“难过、伤心”,何为“开心、雀跃”的能力。

  这种人机语言交互能力的实现,将是AI发展史上的一个重要里程碑,标志着AI从聪明的工具向能够传承人类文明火种的智能体的演变,有助于实现人机和谐共生、共创美好未来的愿景。

  近年来,AI的应用范围及场景越来越丰富,其社交能力大幅提升,在特定场景如引导、陪护、教育中被广泛应用。机器人在某些方面已经具备近似人类情感的理解和表达能力,成为特定人群的生活伙伴,实现从“工具”到“伙伴”的转变。

  医疗领域的沟通与慰藉。美国国家医学科学院数字健康行动联盟于2023年10月召开了一场专题研讨会,探讨了生成式人工智能和大语言模型在医学与生物医学中的应用场景与实施框架。人工智能生成的医疗信息摘要有助于提升患者对疾病和治疗方案的理解能力,从而促使其在医疗决策中发挥更积极的作用。研究还发现,生成式人工智能辅助的信息拟定有助于提升患者与医疗服务提供者之间沟通的清晰度与共情表达,从而增强患者的参与度。一项研究指出,72%的临床医生在使用生成式人工智能起草回复患者的信息时感受到认知负担减轻。在另一项研究中,92%的护士认为该技术提高了效率、同理心及语言表达质量。

  文化领域的理解和共情。2017年,大英博物馆与虚拟现实(VR)公司Oculus合作,推出全新的虚拟现实之旅,帮助浏览者了解每一件文物背后的故事。数据显示,大英博物馆文物的数字化比例达到近50%,建成了超过450万个对象和190万张艺术品图像的在线数据库。数据显示,这种虚实交融的叙事情境,使游客平均停留时间延长40%,对藏品的背景认知完整度提升3倍。当科技成为文明对话的译介者,冰冷的文物便化作连接古今的生命体,不断续写着人类文明的永恒叙事。

  民生领域的监测及协作。英国的“深度思维”团队在2024年研发的最新机器学习模型,可根据当前和未来天气进行可靠的天气预报评估,不仅超过了传统天气预报的最好水平,还能更好地预测极端天气、热带气旋路线和风能产量。

  当游牧民众以“风偷走了我的羊群”的诗意表达传递危机时,系统立即调取卫星牧区图像,并用“羚羊迷途处,总有金合欢树指引归途”的部族谚语回应。这种数字与传统的交响,不仅提升了寻回速率,更守护了口耳相传千年的文明基因。

有“温度”的未来

  “有温度的交互”是实现“人机共生”愿景的基础,而“人机共生”意味着两者形成一个相互依存、相互适应、共同成长的有机整体。这是一条从‌情感连接‌出发,经由‌能力互补的深度协作‌,最终可能走向‌认知与存在层面深度融合‌的演进道路,也是一场深刻的技术革命,更是一次关乎人类文明未来形态的根本性探索。

  ‌“温度”是起点,它让冰冷的机器变得可亲可近,打开了人机关系的情感大门;“共生”不仅要求我们发展技术,更要求我们深刻思考和定义我们作为“人类”的未来。这条道路并非坦途,它要求我们以最大的智慧、最深的责任感和最广泛的共识去谨慎探索和塑造。联合国教科文组织于2021年11月在该组织第41届大会上发布《人工智能伦理问题建议书》,其“以人为本”的核心原则正是这条探索之路上的成果结晶。

  当前应做到“有温度的交互”,为人机情感连接奠基。机器要能识别用户的情感状态(语音、文本、表情、生理信号),并据此调整交互策略(如语气、语速、措辞、推荐内容);人机能进行自然流畅的沟通,如理解上下文、意图和隐含意义;基于用户历史数据和偏好,提供定制化的建议、提醒或支持,让用户感觉“被看见”“被理解”。核心目标是让交互更舒适、高效、减少挫败感,建立初步的信任感和好感度。应用场景体现在AI智能客服、心理健康陪伴助手、教育辅导助手、智能家居等。

  “人机共生”的终极目标是使人类的福祉、潜能得以发挥,社会繁荣最大化,机器将成为这一目标的积极参与者和守护者。抵达“人机共生”的未来,并非意味着机器成为人类,或人类失去独特性,而是不同形态和能力的智能体在不同领域(工作、生活、创造、照护)扮演不同深度的伙伴角色,增强人类能力(认知、情感、创造力)并解放人类去从事更有意义的活动,让人类和机器在持续互动中彼此塑造。

(作者:陈伟,系浙江工商大学浙江省文化产业创新发展研究院研究员、人文与传播学院副教授)

相关内容

热门资讯

浙江仙通涨2.22%,成交额1... 7月17日,浙江仙通(维权)盘中上涨2.22%,截至09:35,报16.57元/股,成交1423.2...
光库科技涨2.01%,成交额7... 7月17日,光库科技盘中上涨2.01%,截至09:35,报50.23元/股,成交7274.44万元,...
中证500ETF工银(5105... 7月17日,中证500ETF工银(510530)开盘涨0.19%,报6.426元。中证500ETF工...
物产环能大涨5.58%,成交额... 7月17日,物产环能盘中上涨5.58%,截至09:35,报13.82元/股,成交8990.79万元,...
星帅尔涨2.00%,成交额42... 7月17日,星帅尔盘中上涨2.00%,截至09:36,报13.76元/股,成交4292.51万元,换...