除夕夜央视春晚上被网友点赞“每一帧都好美”的节目《贺花神》,如同“花”的视觉盛宴。殊不知,这属于中国人的美学浪漫背后有大模型的助力。2月12日,北京企业字节跳动推出视频生成模型Seedance 2.0。“今年的总台春晚是Seedance 2.0的第一个客户。”火山引擎总裁谭待说,正式上线前,该模型就被深度应用于多个春晚节目的视觉制作环节。
当中国观众享受春晚的视觉特效时,像Seedance 2.0这样诞生在北京的国产大模型正引发海外开发者和创作者的疯狂追捧。今年以来,全球迎来新一代大模型的密集发布潮。北京在中国AI企业中一马当先、万“码”奔腾。
大模型上春晚
解决海外模型解不了的难题
《贺花神》节目使用Seedance 2.0模型,为每位演员的表演定制了“一月一人一景,一花一态一观”的视觉奇观,让舞台变成可呼吸、可生长的动态空间。歌手张杰演唱《驭风歌》时,身后水墨画上的骏马活灵活现。不过,水墨风格的素材如此灵动,考验模型对东方美学的理解和泛化能力。此前,一些海外模型由于不理解中国水墨画构图和逻辑,最终生成的视频出现了变形。
“训练阶段我们用了大量东方美学素材,而且它在镜头语言的控制、复杂交互呈现上有非常强的能力,刚好能满足导演组的视觉创意。”谭待介绍。Seedance 2.0模型在训练时加入了京剧、水墨画等中国传统文化语料,可以帮助它更好理解水墨画的逻辑。同时,模型对动作、表情、文字内容等理解能力更强。最终,由该模型生成的画面精准保持了水墨画风格,动态舒展自然,形神兼备。
其实,早在内测阶段,Seedance 2.0就在国外火了。“这发生得也太快了!”该模型生成的一支短片,比几个月前由海外模型呈现的效果更真实、丰富,让埃隆·马斯克发出这样的感慨。此前,由于Seedance 2.0在部分国家和地区尚未开放,不少海外网友在社交平台频频“催上线”。之所以“圈粉”无数,是因为Seedance 2.0解决了AI视频中常出现的变形、可用率低、音画不同步等问题,分镜设计、多镜头叙事能力的出色表现被人直呼“导演级画面”。
全球开发者追捧
300万开发者一半在国外
Seedance 2.0吸引全球目光的同时,一款匿名模型也在海外开发者社区引发轰动——开发者只需有一个点子,后续让模型完成写代码、编程序等任务,就能开发出一款手机应用。
2月11日晚,谜底揭晓:被硅谷追捧的神秘模型正是“全球大模型第一股”智谱推出的GLM-5。为了支撑这款模型在全球各地运行顺畅,位于北京海淀的智谱总部有不少员工选择在春节假期留下来维护运营。
“全球使用智谱GLM 模型的开发者超300万人,有一半都在国外。”智谱CEO张鹏告诉记者,匿名测试原本是想看一下真实反馈进行优化调整。没想到大家已经利用模型开发出横版解谜游戏、智能体交互世界、“论文版抖音”等,有的手机应用只用一天就开发好了。
“大模型在从写代码、写前端网页,进化到完成工程大任务。”张鹏说,GLM-5更善于处理复杂的编程和智能体任务。以AI编程为例,模型不再只是个手速快的程序员,而是能把一个项目从头盯到尾的“总工程师”。有开发者利用GLM-5在12小时内成功开发出一款游戏,完成了传统开发模式下两三个月的工作量。
国芯跑国模
高吞吐低延迟稳定运行
在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源模型第一。开发者的追捧可以印证这份排名:由于用户量激增,智谱编程助手套餐GLM Coding Plan上线即售罄,即使涨价30%也是秒空。
更让人欣喜的是,为支撑来自全球市场的需求,“国芯跑国模”加速运转起来。目前,GLM-5已完成与华为昇腾、摩尔线程、寒武纪等国产算力平台的深度推理适配。通过底层算子优化与硬件加速,GLM-5在国产芯片集群上已经实现高吞吐、低延迟的稳定运行,为国产大模型服务的规模化落地提供坚实基座。
今年春节档这两张AI王牌的背后,是以北京为核心聚集区的中国AI在全球人工智能产业新一轮技术竞赛中实现全面突破,多项指标已达到全球顶尖水平。本报记者 曹政 孙奇茹