本报记者孙乐琪
2022年3月4日,北京冬残奥会火炬在北京接力传递。
中国科学院心理研究所青年特聘研究员王甦菁,一手操作电动轮椅,一手高高擎起火炬。
跳动的火焰,象征着自强不息,如同他人生的注脚。
十多年前,这位“脑瘫博士”不向命运低头的故事,曾牵动万千网友的心。这些年来,王甦菁深耕人工智能领域,已经成长为探索微表情分析和无障碍技术的知名科学家。2024年11月,他带队完成的项目获得了2023年度北京市科学技术奖二等奖。
今年5月16日,第七次全国自强模范暨助残先进表彰大会在京召开,王甦菁荣获“全国自强模范”称号。
每位自强模范背后,都是一个与命运抗争的故事,王甦菁也不例外。
王甦菁
改写人生
“其实,十几年前,《北京日报》就讲过我的故事。”
王甦菁拿出珍藏的2012年1月5日的报纸。当天,本报以《“脑瘫博士”自强不息被誉“中国霍金”》为题,报道了他的科研成果在学术界受到认可的事迹。
“那是我人生的一个闪亮的‘切片’。”彼时,王甦菁还是吉林大学博士研究生,他自强不息的故事感动了无数读者。
王甦菁出生在江苏连云港,出生时母亲遭遇难产、情况危急。抢救了7天7夜后,母子俩从命运手里扳回一局。
从此,王甦菁踏上了闯关不断的人生旅途。
出生时遭遇的艰难,给王甦菁带来了运动功能障碍、说话发音不清等身体上的残障。绝境般的开局,没有击垮他的意志,反而给了他“胜天半子”的勇气。抓握不稳,他就练习抓棋子、抓玉米粒,锻炼握笔写字;下肢摇晃,他就在小腿上绑沙袋,来稳固身体、防止抖动。求学过程中,他从来没有因为身体上的特殊情况,将自己与其他人区别对待。
10岁那年,与计算机的初次相遇,改写了他的人生。
那一年,他在病房中,观看了面向青少年的计算机电视科普节目。如同命定的“缘分”,他一下就迷上了充满未来感的高科技设备。母亲一向支持他的爱好,但一打听才知道,一台“286”电脑需要1万多元。为了不让父母为难,王甦菁不再提买电脑的事,转而钻研起计算机学科相关教材,课余时间读书不辍。上了高一,王甦菁终于拥有了属于自己的电脑。高中毕业时,他已经自学了计算机本科专业的全部课程。
18岁,王甦菁如期参加高考。但由于手抖、写字慢,他在重要的人生考试中没能答完卷。“眼看着题都会,但就是答不完,太让人无奈了。”成绩不理想的他,在家乡读了专科。
世界为你关上一扇门,一定会再打开一扇窗。
计算机,就是王甦菁的“人生之窗”。
1997年,还是专科学生的王甦菁设计出了我国首款CASL(计算机代数系统语言)汇编语言编译器,一经问世便受到了我国计算机软件教学专家、南京大学教授钱士钧的高度评价。同年,他又顺利进入中国大学生电脑大赛全国总决赛,是当时参赛者中唯一的残疾人选手。22岁时,他以高分通过国家级高级程序员资格考试,成为当时领域内最年轻的工程师。2002年,几经努力,王甦菁拿到学士学位。
世界以痛吻我,而我报之以歌。
泰戈尔的诗句,是王甦菁人生的真实写照。
解放双手
亮眼的成绩让王甦菁的故事被许多人“看到”,社会的广泛认可也给他带来了更多的机会。
由于答题速度过慢,王甦菁连续4年考研失利。“考到最后,手上磨出的血蹭到试卷上,监考老师都忍不住落泪,分数线却依然无法逾越。”此时,他在计算机方面展现出的天赋与光芒给他的人生带来了转折。峰回路转,惜才的吉林大学决定破格给他机会。
王甦菁抓住了这个改变命运的转机,一头扎进科研的海洋,专攻计算机视觉和模式识别领域,在吉大一路读到博士研究生。毕业后,他进入中国科学院心理研究所成为博士后,出站后留所从事科研工作。
一路走来,乐观的王甦菁从未怨天尤人,但他也时刻感受着残障给他的人生带来的重重困境。
“我希望所有残障人士,都能过得更从容一些。”推己及人,这是来自王甦菁内心最深处的呼声。多年来,他始终关注着残障人士的处境和无障碍领域的发展,为残障人士能够更加顺利地融入社会而不断发声。同时,他也从未停止对助残科技研发与应用的探索。
在中国科学院心理研究所,王甦菁向记者展示了他带队完成的基于即时定位与地图构建功能的电动交互轮椅——
团队成员首先驾驶智能轮椅在心理研究所一层大厅“走”了一圈,采集位置信息。5分钟内,系统就自动构建出一层大厅的二维地图。随后,团队成员在地图上设置好常去的点位。此后,使用者只要点击按钮,轮椅就可以自动前往预选的位置,长按按钮,还能实现手动驾驶与自动导航模式的切换。
这项科研成果的诞生,缘于王甦菁切身的需求。“当我在食堂打饭的时候,如果操作轮椅,就没法端餐盘。”王甦菁说,手动摇杆的轮椅,需要使用者持续用手操作,对于老年人和残障人士等轮椅的使用者来说,解放双手是提高生活质量的关键一步。
基于“解放双手”的设想,他带队利用物联网与人工智能技术开发了这款自带导航功能,可实现室内建图、路径规划的智能轮椅。同时,利用多传感器融合的定位导航技术,智能轮椅还解决了避障、自主停留等问题,使其在面对各种复杂场景时,具有更好的通适性,运行时更加安全、可靠。
除此之外,智能轮椅还具有自主学习的功能,在使用的过程中,可以通过不断地学习,实时更新地图。“这让使用者的体验越来越‘丝滑’、越来越便捷。”王甦菁说。
这项成果申请了国家发明专利,并被评为中国残联技术公益优秀案例。不久前,智能轮椅还在中国机器视觉助力智能制造创新发展大会、国际康复博览会等大型展会活动上大放异彩。
“希望不久的将来,智能轮椅能够得到进一步的推广和普及,为有需求的残障人士、老年人群等踏平障碍、铺就坦途。”王甦菁说。
深度聆听
王甦菁的家,是一个高度智能化的空间:
手机可以操控入户门的开关;语音可以控制各个房间的照明灯;自动窗帘设有定时器,清晨徐徐开启、迎接朝阳,夜晚自动关闭、隔绝喧嚣;卫生间设置自动升降椅,淋浴设置恒温水;厨房里摆放着各种智能厨具……
他充分利用现代科技,让自己的日常生活在最大程度上更便捷、更自如。
从自身的体验出发,他能切身感受到科技发展对于提高残障人士生活质量的重要意义。站在残障人士与科研工作者的双重视角,他也总是能够更敏锐地捕捉到关键问题。
“辅具的技术突破固然重要,但如何精准对接残障群体的真实需求才是核心挑战。”
由于发音不清晰,王甦菁在使用社交软件、智能工具时,时常感到困难重重。“比如,我使用社交软件的语音转文字功能时,大多数情况下,软件是无法精准转写的。”
智能设备无法进行精准的语音识别,这不是王甦菁一个人面临的困境,“因神经病变、肌肉麻痹或运动不协调而出现言语障碍的老年人、残障人士就不能使用相关的功能了吗?这不合理。”
目前,我国的自动语音识别技术进步很快,方言识别是领域内亟待攻克的新技术难点。王甦菁解释说,如果将构音障碍人士的语音视为一种“方言”,那么就可以将方言的语音识别方法迁移过来。为此,他带队建立了一个专门属于构音障碍人士的语音数据库,通过智能语音分析技术,改善构音障碍人群的语音识别使用体验,从而提高他们的生活质量。
在着手建库之前,王甦菁对领域内的相关研究进行了调研:发达国家早在1993年就构建了第一个英文构音障碍数据库,我国在2015年才构建起第一个构音障碍数据库,不过是粤语版的;2023年初,首个普通话版的构音障碍数据库建立,但规模很小,数据量不到10小时。
要建立数据库,首先要采集数据。但要找到符合条件、不同类型的志愿者参与项目,困难重重。“许多残障人士难以克服身体、心理的种种障碍,不愿参与项目、不敢开口说话。”为此,王甦菁奔波各地,多次在参与特教学院的相关活动时,结合自身的经历,动员符合条件的人士参与其中。“我们要为自己争取、要为自己尽力,才能使自己的生活环境变得更好。”
真切的话语,感染了许多有着同样处境的残障人士。很快,决定参与数据采集的构音障碍者就突破了百人。
由于残障人士往往出行不便,语音数据的采集选择了居家录音形式。在项目组的指导下,志愿者在一个月左右的时间内,分段完成1个小时的语音采集任务,“这样不仅对发音困难的构音障碍人士更友好,采集到的数据也更加精准。”
2023年,在中国计算机大会上,王甦菁主持了一场主题为“AI+辅具:语音,一座沟通的美好桥梁”的技术论坛。在这场论坛上,他代表项目组发布了中文构音障碍数据库。该数据库语音数据总时长超过180小时,是目前最大的中文构音障碍数据库。同时,基于数据库,项目组还构建了一款供构音障碍人士使用的语音识别系统。
“通过算法的构建,我们将语音识别的误差率降低至20%以内。”
王甦菁分别打开项目开发的语音识别系统、市面上常见的语音转文字软件和智能手机自带的语音输入法,向记者展示项目的突破性成果。
“我们收集并发布了目前最大的中文构音障碍数据库,并在此数据库中训练了构音障碍语音识别系统。系统有着很好的性能表现。”
伴随着王甦菁的语音输入,项目开发的系统准确无误地反馈出相应的文字。而另两款软件则无法精准识别内容。
王甦菁表示,该项目仍在不断拓展研究、应用的范围。比如,针对构音障碍人士身心康复的聊天机器人正在开发的过程中。“我们希望构建一个基于心理健康知识引导的垂域大模型,能够共情、陪伴、引导有需要的人士,并帮助他们锻炼正确发音、强化发声功能,提高认知功能、改正不良行为,培养社交的能力与信心。”王甦菁说。
查颜识谎
2024年11月19日,北京市科学技术奖在全市科技大会上颁布。王甦菁牵头完成的“微表情表达机制与稀疏深度运动感知研究”项目获得了自然科学奖二等奖的好成绩。捧着证书,王甦菁感慨良多。在微表情识别的领域,他已经潜心探索了超过10年。
微表情的概念由心理学家保罗·艾克曼提出,是人类试图抑制或隐藏真正情感时不经意泄露的短暂的、不能自主控制的面部表情。不同于普通表情,微表情持续时间仅为1/25至1/5秒。
为什么要研究微表情呢?王甦菁说,微表情是谎言检测的重要线索之一。微表情的识别与检测技术可应用于测谎设备的研发。“临近博士毕业时,我看了一部电视剧《别对我说谎》,其中有不少通过分析人脸微表情来判断说话真假的剧情。”电视剧里,微表情识别的神奇技术引起了王甦菁强烈的好奇心。微表情研究能否与自己从事的计算机领域进行交叉融合呢?他在领域内进行了调研,发现当时国内关于微表情计算机识别的论文只有5篇。而中国科学院心理研究所的研究员傅小兰正在进行相关课题的推进。
王甦菁与傅小兰取得联系,表达了希望跟随她进行相关科学研究的愿望。最终,经过考核,王甦菁顺利进入心理研究所,成了傅小兰的博士后,开启了对微表情检测与识别的探索。
在心理研究所4楼微表情应用研究中心的实验室里,王甦菁团队的成员正在进行微表情的诱发和采集工作。项目组设计了不同的微表情诱发模式,涉及视频刺激、说谎交互等。整个实验过程中,志愿者要尽力“不动声色”,避免流露自己的真实情绪。实验全程录像,团队成员将逐帧分析视频,并对采集到的微表情进行编码入库。
微表情稍纵即逝,想要把它精准识别出来并非易事。王甦菁微表情研究团队的每一名成员都拥有面部动作单元编码系统的认证证书。团队成员东子朝介绍,面部肌肉由五大分支组成,其中每个分支又包含着多个不同的肌肉组织。项目组基于面神经分布和面部动作单元的编码体系,将微表情与不同的情绪建立对应联系。
“比如,眯眼,即收缩眼周肌肉,对应的编号是6,上扬嘴角,即颧大肌斜向上运动,表现为唇角提拉,对应的编号是12 ,一个眯眼笑的微表情,在入库时的面部动作单元编码就是‘6+12’。而这两个动作,往往与高兴的情绪对应。”东子朝解释。
10年来,项目组将流形学习、张量分析、彩色空间理论等计算机视觉领域相关理论应用于微表情研究,取得了许多令人瞩目的成果。他们公开发布了一系列微表情数据库,迄今已被60多个国家的300个科研团队累计申请使用千余次,成为国际上被引用次数最多的微表情数据库。同时,团队推动微表情算法的发展,利用数据库训练形成微表情深度学习模型,构建起能够识别微表情的智能分析系统。
目前,该项目的研究成果已经开始应用在相关领域。同时,项目组也正在着手与医疗卫生领域的科研和临床机构合作,探索微表情在心理疾病、情绪问题的精准识别、评估、诊疗等方面的应用。
甦,是死而复生。菁,是草木葳蕤。
那个在出生时艰难“闯关”的孩子,不仅凭借自强不息的意志,书写了勃勃生机的人生,还奋力展开了科技创新的巨大羽翼,只为给与自己有着相同困境的人们遮风挡雨。
上一篇:着眼“宏伟蓝图”深化区域联动