2025 年 3 月 7 日,阿里巴巴宣布旗下 AI 视频生成模型通义万相 Wan正式推出独立官网(wan.video),用户可直接通过浏览器体验 “文生视频” 与 “图生视频” 功能。这一举措标志着阿里在生成式 AI 领域的技术突破进入商业化落地新阶段,也为全球内容创作者提供了低门槛、高质量的视频生成解决方案。
通义万相 Wan 依托阿里云自研的扩散变换器(DiT)架构,实现了动态场景与多对象交互的精准生成。其核心优势包括:
- 多模态输入支持:同时兼容文本和图像输入,用户可通过文字描述或上传图片快速生成 5 秒短视频。
- 国风内容优化:针对中国传统文化元素进行专项训练,能生成水墨动画、历史人物动态等特色内容。
- 跨风格生成能力:支持写实场景、3D 动画、卡通渲染等多种风格,满足广告、影视、教育等多场景需求。
在权威评测 VBench 中,通义万相 Wan 以84.7% 的综合得分位列榜首,其生成的视频在动作连贯性、细节还原度等指标上显著优于行业竞品。
新官网采用轻量化设计,用户无需本地部署即可通过 Google 或 GitHub 账号一键登录。核心功能包括:
- 每日签到积分:连续登录可累积积分,用于兑换更长视频生成时长。
- 创意灵感库:内置丰富 prompt 模板,涵盖节日祝福、产品演示等场景,降低创作难度。
- 多语言支持:同时提供中英文输入界面,适配全球化用户需求。
通义万相 Wan 的独立站上线,标志着阿里正式加入全球 AI 视频生成赛道的竞争。与竞品 Sora、Runway 相比,其差异化优势在于:
- 本地化服务:深度优化中文语境,支持 “春节舞龙”“水墨画动态” 等国风场景生成。
- 开源生态协同:基于此前开源的万相 2.1 模型,开发者可快速定制专属视频生成插件。
- 算力成本优势:依托阿里云基础设施,实现更高效的模型推理与成本控制。
目前,通义万相 Wan 已开放 API 接口,企业用户可通过阿里云平台集成视频生成功能,加速电商展示、游戏 CG 等领域的内容生产。
阿里表示,未来将持续优化模型性能,计划推出以下功能:
- 长视频生成:将单条视频长度从 5 秒扩展至 30 秒以上。
- 多模态交互:支持语音指令与视频生成联动。
- 虚拟场景搭建:通过文本描述自动生成 3D 虚拟空间。
结语
通义万相 Wan 独立站的上线,不仅是阿里 AI 技术落地的重要里程碑,更预示着视频创作进入 “AI 普惠化” 时代。当用户只需输入一段文字或一张图片,就能生成专业级动态视频时,我们正见证 AI 从辅助工具向创意引擎的蜕变。随着技术迭代与生态完善,通义万相 Wan 或将重塑内容产业格局,开启 AI 视频创作的新纪元。
共有 0 条评论