每经记者|石普宁 每经编辑|唐元
“拨开尘污和泥土,我会让她复活”……
在成都城市音乐厅上演的“致敬音乐剧《金沙》20年音乐剧场”中,当男主角“沙”的扮演者沙宝亮唱起剧中经典的《总有一天》,舞台大屏幕上出现了一位身着剧中服饰的“女主角”——“金”的形象,与他对望、合唱。那是姚贝娜,通过AI数字人的形态,实现了一次特殊的“回归”。
20年前,《金沙》作为中国首部大型原创音乐剧问世,当时还是学生的姚贝娜被相中,随之成为女主角“金”的首位扮演者。她的故事,与《金沙》紧密相连。
这次由AI技术支持的舞台“重逢”,在引发观众复杂情感的同时,也将项目本身置于“AI复活”这一话题讨论中。
这类应用的背后,涉及怎样的技术过程与伦理考量?通过“揭秘”由行者AI提供技术支持的“成都样本”,或可一窥该领域当前的技术现实与待解难题。
实现一场舞台级的数字表演,并非简单依靠自动化程序。行者AI联合创始人、技术副总裁江天宇在接受《每日经济新闻》记者采访时,还原了这次合作中声音与视觉部分的技术实现路径。
先看声音的还原。其首要面对的,是数据源的难题。
江天宇表示,团队很难获得姚贝娜纯净的干声(即无伴奏人声),“例如她演唱时的声音,其实是混了各种各样的环境音。”因此,团队需要先通过技术手段,从现有的混合音源中“还原出一个她的干声”,再用AI模型去生成最终的声音。这并非简单的声音克隆,而是要让AI能够在舞台上与真人“合唱”,且须遵循特定的旋律和节拍。
江天宇表示,此次采用的技术路径是为AI模型输入“曲谱”,让其能够依据旋律进行演唱,“歌唱会比平常说话更难,因为它需要模拟包含换气、音色起伏在内的更多细节,这要求AI模型对音乐元素有更深度的处理能力。”
在视觉形象的构建上,团队面临的是如何在大屏幕上呈现一个既真实又能被观众接受的形象。
一个业内普遍存在的难点是数字人形象的逼真度问题,“如果你做得七八十分‘像’,那是最麻烦的,观众会产生所谓的‘恐怖谷效应’。”
据江天宇介绍,为达到舞台呈现所需的可信度,团队首先利用AI技术对姚贝娜出演《金沙》时期的老旧照片进行高分辨率提升,再结合当年她佩戴过的头冠实物等素材,由人工进行精细化的三维建模,尽可能还原其当年的舞台形象和神态。
从接手到最终呈现,江天宇和团队耗时约三个月。他坦言,在解决了声音和视觉的基础技术问题后,一个综合性的挑战随之而来:如何让一个AI“演员”真正融入一场高规格的现场音乐会?
他举例说,此前团队自评能做到80分的技术效果,但在合作的专业声乐老师看来,“就只有60分”。而正是这种来自艺术领域的专业反馈,驱动团队在专家指导下,对AI的换气、情感注入等表演细节进行了更为精细的调校和打磨。
最终,这个被精细调校的数字表演,与沙宝亮的现场演唱、交响乐团的伴奏实现同步,完成了在技术稳定性和艺术融合度上的一次综合考验。
记者注意到,当前AI“复活”类技术大体落地呈现出两条路径。一是面向特定机构和项目的高规格、定制化数字内容创作。二是面向个人用户(C端)的情感慰藉类服务。
不过,据公开报道,C端服务也引发了部分担忧。有业内人士指出,一来其涉及复杂的伦理悖论和法律风险,二来技术对人性复杂性的简化处理,也可能导致数字形象丧失真实意义。这些现象都显示出,该领域的技术探索正与复杂的伦理规范问题并行。
面对这些复杂的背景,江天宇在采访中谈到,团队在处理《金沙》这一项目时,从授权获取到内容使用,都有明确的边界。此外,双方也确定了生成内容的使用范围。“仅限于此次音乐剧使用,而不会用作其他项目,”江天宇表示,未来也不会主动进行二次开发。
将视线放至行业层面,该领域依然存在诸多待解的议题。
正如英国剑桥大学研究员Katarzyna Nowaczyk-Basinska在媒体采访时指出,AI“复活”仍是一场“巨大的技术文化实验”,其长短期心理影响尚不可知。
技术的进步与公众的情感接受度之间也存在张力,如此次演出中,部分观众“宁愿看录像也不愿看AI”的观点,就反映出公众对“原真性记忆”的坚守与技术“再创造”之间的潜在矛盾。
归根结底,当技术开始介入承载着复杂情感的个人记忆时,它所开启的对话才刚刚开始。如何让技术发展与社会伦理、公众情感更好地协同,是整个行业需要持续面对和探索的课题。