季度AI视频生成产品:多模态输入成标配,角逐一站式生成能力 | 量子位智库AI 100
创始人
2025-10-18 18:43:51
0

分析师 刘萌媛 奕然

量子位智库 | 公众号 AI123All

Sora2五天下载量破百万次,引爆AI视频生成热度。

现在谷歌直接对标Sora2推出Veo3.1,主攻音频生成助推形成新高潮。

国外大厂你追我赶,将AI视频生成卷到电影制作级的创意能力。

国内企业也不甘居后,追求秒级生成且高清、稳定的视频产品,并落地更加细化的垂直场景

此外,视觉模型与世界模型的深度融合,也让AI视频生成产品能够构建更加逼真细腻的3D物理场景,为无限且一致的视频生成提供技术动力。

综合性、多维度 的技术演进路径

在生成能力上,多模态输入已成为标配,普遍支持文生视频、图生视频,并逐步实现音画同步生成,更进一步者实现Agent一站式生成,打造AI视频生成全流程体系。

在输出质量上,角色一致性、分镜设计、关键帧控制及口型同步等更加稳定可控,输出视频时长从几秒显著延长至数分钟,同时画面分辨率普遍提升至2K甚至4K级别,帧率可达60fps,确保了流畅的视觉体验,为各类场景应用提供稳定性高质量服务。

从用户数据来看,也印证了这一趋势。

量子位智库9月最新观察数据显示,共有5款AI视频生成产品访问量超过20万,分别是「旗舰100」中的即梦AI、可灵AI、RoboNeo、海螺AI,以及「创新100」榜单中的Vidu

即梦AI APP下载量突破1100万,访问量增长27%,达到约950万;可灵AI web端月总访问量超过100万,紧随其后的是美图的RoboNeo。

此外,综合类AI产品如豆包、通义万相、智谱清影、阶跃AI等也具备AI视频生成功能。(详情可见量子位智库其他AI产品观察报告)

旗舰10001、即梦AI(Agent)

来自字节跳动。核心定位为下一站式AI创作与内容平台

即梦AI核心功能包括「AI图片生成」和「AI视频生成」。图片生成层面,依托Seedream 3.0/3.1模型,支持一句话改图、平面草图转3D功能、智能画布和动态海报等功能。

视频生成层面,基于Seedance 1.0模型,支持文生视频和图生视频(最长3分钟),Agent模式可以一站式生成视频,提供首尾帧控制、镜头运动、对口型数字人和故事创作模式(剧本→分镜→成片)等功能,画面细节、物理运动一致性方面表现出色。

△即梦AI web端主页02、腾讯混元3D

来自腾讯。核心定位为一站式3D内容AI创作平台

腾讯混元3D基于混元3D 2.5模型,支持文生3D和图生3D,且通过世界模型还支持文/图生360°沉浸式场景,可自由漫游、物理仿真,让「一句话变3D世界」从概念走向真正的生产力工具。

△腾讯混元3D web端主页03、可灵AI

来自快手。核心定位为AI创意生产力平台

可灵AI基于快手自研可灵 2.5 Turbo模型,提供具备稳定性更强的高质量视频、及图像生成和编辑能力,支持「首尾帧稳定丝滑的画面衔接」「多图参考指定角色生成视频」「拥有百余种风格」,满足创作者在想象力发挥以及对创意素材生产与管理的需求。

△可灵AI web端主页04、小云雀(Agent)

来自字节跳动。核心定位为零门槛AI内容创作Agent

小云雀接入Seeddream4.0模型,支持一句话AI生成脚本、分镜、剪辑、配乐的视频全流程生产,可商用数字人输入文字自动生成口播视频,可生成视频长度15s-60s不等,普通人也能产出专业级视频。AI图片设计支持智能换背景、光影优化、精准抠图等功能。

△小云雀app端介绍页05、海螺AI

来自MiniMax(稀宇科技)。核心定位为AI视频生产力平台

海螺AI支持文生视频和图生视频,还能将2D插画转动态视频,实现动画电影级效果。AI驱动角色情感展现增强视频感染力,支持2K高清视频生成,帧率60fps,可在30秒内创建6秒的短视频片段。

△海螺AI web端主页06、绘想

来自百度,核心定位为AI视频创作平台

绘想基于自研MuseSteamer模型,提供Turbo/Pro/Lite/有声版/1.0turbo五种模型选择,支持音视一体化视频生成及11种创意特效,适配中文语境,适用于短视频创作、广告制作等场景,并增添长视频内测。

△绘想 web端主页07、开拍

来自美图公司。核心定位为用AI制作网感口播视频的生产力工具

开拍旨在为创作者打造全链路一站式的影像生产力服务,通过AI帮助口播视频创作者解决从脚本灵感到高清画质拍摄、视频人像精修、后期智能剪辑等全流程问题,支持智能加字幕、智能补帧、眼神矫正、手机电脑协同创作等功能。

△开拍 web端主页08、RoboNeo(Agent)

来自美图公司。核心定位为专注影像生产力的Al Agent

RoboNeo以「一句话搞定影像生产力」为核心,支持对话式修图、设计及视频生成,工作流模式具备全链路图片视频创作能力,支持商业级精修、AI设计生成、视频创作、网页建站等功能,面向电商、品牌、创作者等提供「美图全家桶」级一站式AI影像处理能力。

△RoboNeo web端主页09、Tripo

来自VAST。核心定位为面向专业创作者与大众的云端AI 3D建模平台

Tripo主打10秒级时间把文字或图片变成可打印、可动画、可商用的高保真3D资产,支持文生3D、图生3D、智能分割、智能低多边形生成、魔法笔纹理生成等方向应用。最新的Tripo 3.0模型提供雕刻级几何精度和出色的表面支持。

△Tripo web端主页10、Meshy

来自Meshy。核心定位为零门槛AI 3D资产工厂

Meshy是为创作者打造的AI 3D模型生成器,旨在帮助游戏开发者、游戏工作室、3D打印爱好者和XR创作者等用户,在几秒钟内创建3D模型和动画,支持文本/图像生成3D、AI纹理生成、文字生成贴图等功能。

△Meshy web端主页创新10001、白日梦(Agent)

来自光魔科技。核心定位为文生视频一站式AI创作平台

白日梦支持白日梦4.0、白日梦3.0模型选择,Agent模式可将2000字以内的中文文案自动转为最长6分钟、情节连贯的原创IP视频,新增局部重绘功能让角色、图片更加流畅细腻,支持静态绘本、动态漫画等多形态输出,具有角色DNA库、智能分镜引擎、多模态风格迁移、动态口型同步等功能。

△白日梦 web端主页02、Seko

来自商汤科技。核心定位为创编一体的AI短视频创作Agent

Seko集成主流多模态生成大模型,用户通过自然语言对话即可自动完成从剧本创作、美术风格定位、配音配乐、分镜图绘制的AI短片全流程,支持角色一致性控制、智能模型选择等功能,无需复杂的操作技巧实现大模型全流程代理。

△Seko web端主页03、Vidu

来自生数科技。核心定位为全球领先的AI内容生产平台

Vidu核心功能包括参考生视频、文生视频、图生视频,提供4s和8s两种时长选择,分辨率最高达1080P,最快10s生成视频。可生成高质量的动态视频、2D动画和多样化艺术风格内容,错峰模式支持闲时不卡积分和条数的不限量生成。

△Vidu web端主页04、拍我AI

来自爱诗科技。核心定位是AI视频生成平台

拍我AI基于自研PixVerse V5模型,提供文生视频、图生视频及多特效模板功能,支持多关键帧生成与首尾帧生成动态转场,具备「自定义运镜能力」,内置创意模板库并开放企业级API接口。

△拍我AI web端主页05、Hyper 3D

来自影眸科技。核心定位为高精度AI 3D工厂

Hyper3D基于自研Rodin Gen2 V1.8模型,集成3D ControlNet、LoRA风格模块,支持在几十秒内将2D图像和文本生成高质量3D模型并直接接入主流3D软件,主打「专业可用+极速迭代」,定位3D内容创作者的「Copilot」,支持高质量渲染、个性化定制和多格式兼容。

△Hyper 3D web端主页06、磁力开创

来自快手。核心定位为AI创意生产平台

磁力开创集成Wow智能体(数字人定制创作)、Kwali智能体(一句话生成短视频)及DeepSeek(脚本生成)三大核心能力,提供王牌写手、全能数字人、商品营销官等专项工具,实现从脚本创作到数字人视频生成的全链路营销内容生产。

△磁力开创 web端主页07、造点

来自阿里巴巴。核心定位为多模态视频图像创作平台

造点集成Midjourney V7与通义万相Wan2.5模型,支持图像与视频生成的一站式创作,具备音视频同步生成、图生视频无缝衔接及参数简化功能,提供特征词库与移动端对话式编辑,「美学控制」功能设计滑块,特征词库支持「120多个视角光线构图提示词」。

△造点 web端主页08、万兴天幕

来自万兴科技。核心定位为一站式AIGC创作平台

万兴天幕支持文生视频、图生视频、视频续写等功能,可实现不同风格、丰富场景及主题的连贯性,在图片生成层面具备文生图、局部重绘、参考图生图等功能,在音频生成层面支持文生音乐、文生音效、文生语音、视频智能配乐等功能。

△万兴天幕 web端主页09、Medeo

来自一生智能。核心定位为一句话出片的端到端AI视频工作室

Medeo通过Agent一站式处理脚本、分镜、素材匹配、配音、字幕、音乐等视频全流程,用户仅需输入文字或粘贴链接即可在10分钟内拿到可编辑、可交付的专业短片。

△Medeo web端主页10、MOKI

来自美图。核心定位为AI视频短片创作工具

MOKI基于自研奇想大模型,支持从脚本生成、分镜绘制到视频合成的全流程创作。可生成完整分镜脚本并自定义视觉风格,支持「角色定制」与「分镜画面实时修改」,具备智能剪辑、AI配乐及自动字幕功能,有效简化动画短片、网文短剧等内容的视频制作流程。

△MOKI web端主页11、SEELE

来自全灵科技。核心定位是端到端多模态3D游戏生成平台

SEELE支持零代码一句话生成3D游戏,具有角色控制、场景构建、自主协调交互行为、物理效果及剧情设计等功能,支持无限对话式重制编辑和内容播放,能够生成跑酷、赛车、教育模拟等多种游戏类型,实现从创意到成品的全流程自动化开发。

△SEELE web端主页12、FilmAction

来自瀚皓科技。核心定位是一站式电影生成平台

FilmAction基于自研FANTASY2.0模型,整合影像工作流,支持最高16K视频生成与角色场景一致性控制,提供从剧本创作、角色生成、分镜设计、旁白配音配乐到视频合成等全流程一站式自动化制作,缩短制作周期,适用于电影制作、教育培训及广告创意等多种场景。

△FilmAction web端主页13、美册

来自优频科技。核心定位是AI视频生成工具

美册具有视频抠像、3D模型制作、「手绘视频」及智能字幕等功能,集成特效模板与音乐相册制作,支持多种比例输出与3D环绕音效,适用于短视频制作、电子相册及创意特效等场景。

△美册 app端介绍页14、Video Ocean

来自潞晨科技,核心定位为AI agent视频创作平台

Video Ocean接入GPT-5,通过视频智能体实现对话式脚本策划、视觉合成到配音字幕的全流程自动化,完成支持多语言背景音乐与实时字幕嵌入,几分钟可生成视频。

△Video Ocean web端主页15、影伙引擎

来自小影科技。核心定位为AI出海商业内容解决方案专家

影伙引擎集成跨平台音视频编辑引擎、端侧多模态AI引擎及AIGC生成引擎,提供智慧视频创作、AI短剧制作与AI营销视频三大服务,支持4K/8K编辑、多模态数据处理与个性化内容生成,覆盖影视创作、跨境电商及短剧出海等场景。

△影伙引擎 web端主页16、Boolvideo

来自布尔向量。核心定位为一站式AI视频生成器

Boolvideo面向全球电商与内容营销场景,支持多种内容转视频,可将产品链接、博客文章、脚本、图片等多种内容形式转化为视频,如输入产品URL可直接生成产品宣传视频,支持Shopify、Amazon、Etsy等电商平台。

△Boolvideo web端主页

专属AI产品从业者的实名社群,只聊AI产品最落地的真问题

相关内容

热门资讯

最新领导干部忠诚干净担当心得体...   最新领导干部忠诚干净担当心得体会【1】  “广大纪检监察干部要心存敬畏和戒惧,做遵纪守法的表率,...
最新或2023(历届)三严三实... 最新或2023(历届)三严三实忠诚干净担当学习心得体会【1】  习近平总书记在十八届中央纪委五次全会...
医院事业单位忠诚干净担当学习心...  心得体会范文一:  党的十八大以来,习近平总书记高度重视干部队伍建设,就培养党和人民需要的好干部作...
党员学习三严三实忠诚干净担当心... 党的十八大以来,习近平总书记高度重视干部队伍建设,就培养党和人民需要的好干部作出一系列重要论述。最新...
党员干部学习忠诚干净担当心得体...   党员干部要“对党忠诚、个人干净、敢于担当”。这是习近平总书记在对云南工作作出指示时强调的重要内容...