Vidu 推出“一键生成 MV”:多智能体驱动,全自动视频创作迈入新阶段

国内领先的视频大模型平台 Vidu 今日正式上线开放平台全新功能——“一键生成 MV”。这一能力的发布,意味着视频创作正式从以往依赖人工剪辑与素材拼接的模式,升级为端到端的全自动生成流程,为音乐视频制作带来范式级变革。

在该功能下,用户只需上传背景音乐、参考图片,并输入简要的文字指令,系统便可在分钟级时间内自动生成画质精美、节奏精准、叙事连贯的高质量 MV。复杂的制作流程被高度压缩,创作体验接近“所想即所得”。

多智能体协同,构建虚拟制片厂

“一键生成 MV”的背后,是一套高度协同的 Multi-Agent(多智能体)系统。当用户提交任务后,多个具备明确分工的 AI 智能体会并行工作,完成从创意理解到成片输出的全过程。

  • 导演智能体 会首先对音乐结构、节奏与歌词进行深度解析,梳理整体情绪走向与叙事逻辑;

  • 分镜脚本智能体 随后将创意转化为专业级镜头方案,明确景别、运镜方式与镜头时长;

  • 视觉生成智能体 则依据分镜脚本生成视频内容,确保画面质量与风格统一;

  • 剪辑与合成智能体 负责卡点转场、节奏匹配,并自动生成与歌词逐帧同步的动态字幕。

整个流程无需人工干预,真正实现了“全自动制片”。

工业级稳定性,风格长时间不漂移

在视觉生成层面,Vidu 展现了接近工业级的稳定表现。通过“多图参考生视频”技术,创作者最多可上传 7 张参考图 作为视觉锚点,用于锁定角色形象、场景设定与整体美学风格。

即便视频时长达到 5 分钟,系统依然能够保持角色外观、环境细节与视觉风格的高度一致,有效避免常见的画面漂移问题。

音画精准同步,交付速度再提速

在后期制作阶段,AI 可自动识别背景音乐的节奏与情绪变化,完成镜头转场的精准卡点,并同步生成逐帧匹配歌词的动态字幕。从指令输入到成片输出,全流程仅需数分钟,大幅提升内容交付效率。

让创作回归创意本身

这种“全自动虚拟制片厂”模式,显著降低了专业视频创作的技术门槛。对创作者而言,Vidu 不再只是一个生成工具,而是一个集导演、编剧、摄影、剪辑于一体的智能创作平台,让复杂的 MV 制作变得像发送指令一样简单。


划重点

🎬 多智能体全流程自动化:导演、分镜、视觉生成、剪辑四大智能体协同工作,一站式输出成片
🖼️ 工业级风格一致性:支持最多 7 张参考图,5 分钟视频风格稳定不漂移
🎵 音画精准卡点:自动识别音乐节奏与歌词,分钟级生成带动态字幕的完整 MV