制图:李芷琪(豆包AI)
“AI方大同”翻唱《珠玉》刷屏推荐页,“AI孙燕姿”《发如雪》翻唱视频以360万+播放量刷新热度纪录,音乐圈出现了一场意料之外的变化。当AI歌手从二次元小圈层进入大众文化,直接面对的,是陷入三重版权侵权的争议。
破圈
AI精准复刻
网友称比原唱更像原唱
今年6月,以“AI方大同”声线翻唱的《珠玉》视频出现在社交平台,这首由单依纯原唱的歌曲被重新编曲为融合传统民乐与现代R&B的版本,播放量最高达120万次。用户惊叹于AI对“方氏转音”的精准复刻——如副歌部分“珠玉在侧”的颤音处理,评论区称“比原唱更贴合方大同的音乐哲学”。这类视频通过“经典曲目+顶流声线+风格混搭”的组合,迅速成为破圈利器。
早在2023年上半年,B站用户打开推荐页时,十有八九会刷到“AI孙燕姿”的翻唱作品。这个由人工智能生成的虚拟歌者,以孙燕姿极具辨识度的声线演绎其他歌手的经典曲目,甚至跨界挑战魔性歌曲,单条视频最高播放量突破百万次。用户惊叹于“音色逼真到像本尊开小号”的同时,“AI周杰伦”“AI王菲”“AI陶喆”等克隆歌手也相继涌现,从B站视频到网易云专属歌单,形成“万物皆可AI”的创作景观。
更早在2003年,雅马哈推出的VOCALOID技术就已开启虚拟歌手时代,初音未来凭借《甩葱歌》成为亚洲现象级虚拟偶像。但早期该技术因电子音色生硬、缺乏情感表达,始终局限于二次元“V圈”。直到2020年Dreamtonics公司更新Synthesizer V引擎,通过神经网络技术实现“呼吸声、转音与真人无异”的演唱效果,AI歌手才真正具备破圈可能。而2022年So-Vits-SVC模型的出现,则彻底降低了真人声线克隆的技术门槛——用户可用数小时的歌手干声素材,通过该模型训练出专属AI歌手。
技术迭代催生了内容井喷。B站UP主“陈墨瞳1995”曾在一周内发布10个“AI孙燕姿”视频,最火爆的一期视频播放量超过360万;更魔幻的是跨语种、跨次元的创作实验:打雷姐AI翻唱《大悲咒》、Kanye West声线演绎《阳光彩虹小白马》,这些打破常规的作品在社交平台引发裂变式传播。
现象
开源社区出现“声线破解教程”
AI翻唱账号一天发4-10条内容
AI歌手的诞生,本质是一场声音的数字克隆。以“AI孙燕姿”为例,其技术实现依赖于So-Vits-SVC,尽管该项目已停止维护,但其衍生的4.0-v2模型仍在AI音乐社群中广泛使用。该模型实现声线克隆的步骤可拆解为数据采集、模型训练、参数调校三个核心环节。
数据采集是克隆声线的基础工程。开发者需收集目标歌手的高品质干声素材。模型训练类似于让AI拥有迁移学习的能力,这一过程依赖深度学习算法。以So-Vits-SVC为例,通过学习歌手的音高、音色、节奏等特征参数实现类似“声音指纹提取”。更有甚者还支持“跨语种声线融合”,如将方大同的中文发音习惯与英文歌曲旋律结合,生成类似《The Way I Still Love You》的双语翻唱版本,这类作品在B站播放量普遍破10万。
参数调校是决定AI歌手质感的关键。如演唱《发如雪》高音段时,开发者需精细调节“气息振动频率”参数,避免出现演唱高音时的“虚声”问题。业内人士透露,专业调校者需花费数小时打磨细节。
另外,开源社区中出现“声线破解教程”,指导用户通过“频谱图逆向工程”提取歌手声纹特征。这使得“AI翻唱工作室”在短视频创作者中普及——南都研究员在某社交平台观察到,一些AI翻唱为主的账号一天就可发布4-10条内容,完全可通过“蹭热歌+克隆顶流”模式实现快速涨粉。
AI音色克隆技术的滥用也会加剧侵权风险,催生“AI声音黑市”。某二手平台现“AI声音克隆”服务,卖家宣称“可定制任何歌曲”。南都询价后了解到,用户需要提供音色提供方的单人声音素材,完成一首AI翻唱歌曲价格基本在80-100元,一般需一天,“只有难度太高的歌会贵些”。这种交易暴露了AI歌手产业的灰色地带:当技术门槛降至“百元级”,未经授权的声音克隆已成可批量生产的商品。
法律
使用未授权歌曲素材训练AI
现行《著作权法》无明确界定
当“AI方大同”翻唱《珠玉》的视频获得海量播放量时,或已同时触及三重版权红线:方大同声线的声音权、词曲作者的版权。若AI训练素材来自未经授权的现场录音或粉丝录制音频,还可能侵犯录音制作者权,即邻接权侵权。
西南政法大学副教授孙山指出:“训练AI的过程中使用未授权歌曲素材,现行《著作权法》对此尚无明确界定,这是技术发展带来的法律空白。”
首先,声线作为歌手表演的重要组成部分,“AI方大同”未经授权使用歌手发声方式,本质是对表演者权的侵犯。其次,《珠玉》的原曲著作权属于词作者唐恬与曲作者钱雷。社交平台、视频平台大量AI翻唱视频若未获得作者授权,涉嫌侵犯机械复制权与信息网络传播权。按既往案例推测,若单条百万播放量视频按版权费标准计算,侵权方可能面临数万元赔偿。最后,录音制品的“邻接权”同样容易在这一场景下被忽视。“AI方大同”使用的干声素材若来自未经授权的录音制品,就可能造成邻接权侵权。
AI歌手的爆火也催生“声音遗产”伦理争议。当AI技术“复活”方大同等已故歌手,甚至通过算法生成他们从未演唱过的原创作品时,关于逝者尊严的讨论也愈发激烈。
为规范人工智能生成合成内容标识,国家互联网信息办公室、工业和信息化部、公安部、国家广播电视总局制定《人工智能生成合成内容标识办法》,明确人工智能生成合成内容需要添加显式标识或者隐式标识,并将于2025年9月1日起施行。其中,显式标识指在生成合成内容或交互场景界面中添加的,以文字、声音、图形等呈现并可被用户明显感知到的标识,明确哪些内容是生成的,起到提醒用户的效用。其中由AI合成的音乐也需要在其中进行打标动作,而AI歌手这类作品正是需要被纳入监管的重要组成。
采写:南都记者 孔令旖
上一篇:英伟达聘请两名中国年轻AI专家