中经记者 李静 北京报道
《黑神话:悟空》制作人冯骥用“地表最强视频生成模型,没有之一”盛赞字节跳动最新推出的Seedance 2.0,称其终结了AIGC的“童年时代”。而知名博主影视飓风的Tim在实测后,更是连用六个“恐怖”来形容这款新的视频生成模型,仅上传一张Tim的面部照片,Seedance 2.0就能精准还原其个人音色,甚至能生成照片外真实场景的运镜画面。(由于Tim是明星级公众人物,其生产的高质量视频素材在网上大量公开流传,很可能被各大AI模型用于训练。)
舆论在惊叹Seedance 2.0的技术突破的同时,也对潜在的风险展开了大讨论。
对于内测用户反馈的情况,字节跳动旗下的即梦在2月9日紧急调整Seedance 2.0的功能策略:暂停支持用户上传真人图片或视频作为主体参考,并限制仅在完成活体认证后方可生成真人形象视频。
这一“急刹车”举措,不仅折射出企业在技术狂奔中的合规焦虑,更将视频生成大模型长期悬而未决的版权与人格权争议推至台前。
上海汉盛律师事务所高级合伙人李旻律师在接受《中国经营报》记者采访时指出:“视频生成大模型的风险点本质在于其多权利要素的聚合性,与图像静态单要素、文本无具象权利要素的特征有显著差异。”
技术狂奔下的合规痛点
AI 大模型的发展离不开海量公开数据的训练,这是全球行业的普遍技术路径,视频生成模型更是如此。
例如谷歌的Veo 3模型训练使用了超过200亿个YouTube视频片段,OpenAI的Sora模型也依赖海量公开及许可视频数据,字节Seedance 2.0的训练素材同样涵盖公开数据集和付费版权库。
而字节Seedance 2.0自发布以来,因其“双分支扩散变换器”架构实现音画原生对齐、多镜头叙事连贯性等突破,被业内视为继OpenAI Sora之后又一里程碑式产品。不过,技术上的飞跃同时也放大了行业面临的法律与伦理风险。
北京航空航天大学人工智能研究院教授沙磊指出:“当前主流AI视频模型普遍依赖海量公开数据训练,类似Tim这样的公众人物视频进入公开数据集非常正常。”
浙江垦丁律师事务所联合创始人欧阳昆泼对记者指出:“行业的现状确实是大规模训练数据未经授权使用。高质量视频数据集中于少数版权方(如影视公司等),合规数据数量太少,不足以支撑当前模型能力。技术社区也常见使用‘爬取-清洗-训练’的模式。”
“更关键的问题在于,视频生成大模型的学习本质是高维空间的概率拟合。”北京市社科院副研究员王鹏对记者指出,“当拟合程度极高时,会出现类似‘过拟合’的特征重现,即生成内容与特定个体高度相似,甚至可被识别为本人。”
李旻解释:“视频是多权利要素的聚合体,包含画面、音频、肖像、声音、配乐等,涉及的权利主体复杂,且拟真度高,普通用户难以分辨真假。”
行业发展的命门:平衡创新与版权保护
事实上,字节跳动已在技术落地中尝试设置合规防线。
据了解,目前字节Seedance 2.0仍处于小范围内测阶段;同时2月9日开始,字节Seedance 2.0限制了真人素材参考功能,还设置了活体认证才可以生成真人视频的门槛,同时对名人、知名IP的视频生成进行严格审核,例如当用户尝试生成李连杰、成龙等名人相关视频会被系统拦截。
中国科学院软件研究所研究员张立波认为,技术发展往往领先于行业规则的建立,与此同时,训练过程中可能涉及的内容借鉴、版权关联等议题,也成为技术突破和行业发展必须面对的共性挑战。“但我们也清醒地认识到,如何在此过程中更好地保护公众个人隐私,并确保生成内容的安全可靠,是亟待社会各界共同推动解决的重要课题。”
沙磊也指出:“AI的进步不会因争议停下脚步,如何在技术创新与数据合规、版权保护之间找到平衡,让技术突破的红利真正惠及行业与用户,不仅是字节或某家公司需要持续探索的问题,更是全球AI产业共同的命题。”
可以看到,行业也在积极探索技术治理方案。王鹏指出,推行“AI 水印”和“数字签名”制度是行业发展的一项关键举措,让每一段生成视频都带上不可篡改的溯源码,实现生成内容的可识别、可溯源、可追责。同时,人脸核验、生成日志等技术手段也能在一定程度上降低黑灰产的操作空间。
需要正视的是,当前这些主要技术措施(水印、标识)存在根本性缺陷。“模型本地化部署后,生成行为脱离平台监管,水印可被破解,且无日志留存。以及‘反检测’生成技术,可通过对抗训练生成能欺骗检测器的视频。”欧阳昆泼对记者指出,“现在最大的问题就是缺乏司法可信级别的溯源技术。现有的水印多为平台自定标准,无法形成跨平台、法律认可的电子证据链。”
从法律层面来看,完善的规则体系是行业健康发展的保障。目前网信办等七部门发布的《生成式人工智能服务管理暂行办法》为视频生成模型构建了基础监管框架,确立了发展和安全并重、分类分级监管的原则,要求训练数据来源合法、生成内容按深度合成规定标识。
但李旻同时指出,该框架尚未完全适配视频生成模型的特点,现行办法未对视听素材训练数据合规、生成内容标识标准与溯源要求作出具体细则规定,实操中存在监管空白。“未来监管需要坚持训练数据与生成内容并重的方向,从源头明确数据合规要求,同时强化生成内容的过程管控和结果处置,通过溯源机制实现全链条监管。”
欧阳昆泼也认为,《生成式人工智能服务管理暂行办法》第七条已要求“使用具有合法来源的数据”,但缺乏操作细则。未来监管对训练数据的合规审查将成为行政许可或备案的核心要件,类似《中华人民共和国网络安全法》对数据的要求。
“生成内容的深度合成标识(《互联网信息服务深度合成管理规定》第十七条)是底线要求,但治本之策在于训练源头。”欧阳昆泼预判,监管可能引入训练数据影响评估与版权白名单制度,推动行业采购正版数据池。
在规范中寻找技术落地的最优解
虽然字节的Seedance 2.0引发了争议与调整,但并未阻挡AI视频生成技术的发展步伐,反而让行业更加清晰地认识到,合规是技术商业落地的前提,只有在规范的框架下,技术创新才能真正释放红利。
事实上,Seedance 2.0的技术突破已经让行业看到了AI视频生成的巨大潜力,其多镜头叙事、音视频同步等能力,能大幅降低视频制作成本,让普通人也能做出大片质感的内容,在短视频、广告、影视制作等领域具有广阔的应用前景,甚至有望重构传统视频制作的组织结构与流程。
“如果说Sora确立了画质高度,Seedance 2.0则确立了生产工具的精度。它证明了视频生成模型正从‘特效滤镜’转变为‘云端制片厂’,可能会倒逼其他大厂加速音频分支的整合,让单模态模型迅速过时。”王鹏认为,AI视频行业正在迎来属于行业的“奇点时刻”,Seedance 2.0正将行业卷向全流程生产能力。
近日,影视传媒板块已经因Seedance 2.0的推出迎来股价大涨,例如中文在线、掌阅科技、欢瑞世纪、荣信文化、光线传媒等多只影视传媒股票价格均出现显著上涨。资本市场的热情反映出行业对AI视频生成技术的高度期待。
但资本的追捧更需要理性的支撑,只有解决了版权、合规等核心问题,才能让技术真正走向商业化落地,推动行业实现高质量发展。
张立波表示:“相关素材纳入公开数据集属于行业常见情形,普通用户无须过度焦虑。但如何更好地保护公众个人隐私、确保生成内容安全可靠,是亟待社会各界共同推动解决的重要课题。”
李旻建议,可以构建一个能够适配视频生成模型“事前、事中、事后”的全流程治理体系:
事前,细化训练数据合规要求,推进素材授权与合规数据平台建设,按模型特性做分类备案和安全评估,督促完善技术防护与标识能力并做好用户合规引导。
事中,强化生成内容标识溯源,建立统一技术规范和信息共享机制,压实平台审核、投诉处理等责任,动态管控用户违规使用行为。
事后,明晰各方责任划分,完善侵权证据留存调取要求,推动多部门协同监管执法,引导行业自律并建设合规规范,形成多方共治格局。
从全球来看,AI视频生成产业仍处于发展初期,技术创新与规则建立的双向探索仍在继续。字节Seedance 2.0的调整,是中国企业在技术发展中重视合规的体现,也为全球行业提供了参考样本。这一过程,也将推动中国AI产业在全球竞争中,占据技术创新与合规发展的双重优势,为全球AI产业的发展贡献中国方案。
(编辑:张靖超 审核:李正豪 校对:颜京宁)