香港科大联合 DeepSeek 推出开源音乐大模型 YuE:双轨生成技术突破创作边界

 

AI 音乐开源领域迎来里程碑式突破!香港科技大学与音乐科技公司 DeepSeek 联合研发的 YuE 音乐生成模型正式开源,凭借创新的双轨生成技术和多模态处理能力,为专业音乐人及爱好者提供了革命性的创作工具。项目地址:https://github.com/multimodal-art-projection/YuE

 

 

架构创新:双 LLaMA 架构实现多模态融合
YuE 采用独特的双 LLaMA 语言模型架构,突破传统音乐生成模型的单轨限制。通过分离人声与伴奏的独立建模系统,实现 5 分钟完整歌曲的端到端生成。这种双轨并行的处理机制,不仅支持中英日等多语言歌词创作,更能同步生成专业级伴奏,使音乐创作效率提升 40% 以上。

 

技术突破:三大核心算法重塑创作逻辑

 

  1. 双轨版下一 token 预测:通过独立轨道的动态预测机制,确保人声与伴奏在旋律、节奏和情感表达上的高度协同
  2. 结构化渐进生成:创新的段落交替生成技术,使主副歌过渡更自然,歌曲结构完整性提升 65%
  3. 音乐上下文学习:基于 300 万首开源音乐库的学习优化,有效避免创作重复,独特性指标达行业领先水平

 

性能验证:多维度超越商业闭源工具
在最新的盲测对比中,YuE 生成的人声细腻度和伴奏复杂度得分分别达到 9.2/10 和 9.1/10,综合表现超越主流闭源工具 Suno 和 Udio。其支持的多乐器实时替换、智能混音调节等功能,更受到专业制作人的高度评价。

 

生态布局:开源社区推动创作民主化
通过开放 API 接口和模型参数,YuE 正在构建全球首个音乐创作开源生态。开发者可快速集成音乐生成、音色克隆等功能,而普通用户通过 Web 端即可实现 "歌词输入 - 歌曲生成 - 混音导出" 的全流程操作。目前已有超过 500 支独立乐队使用 YuE 进行专辑创作。

 

随着 YuE 的技术迭代和应用拓展,AI 音乐创作正从实验阶段迈向产业化发展。这一开源模型的出现,不仅降低了音乐创作门槛,更将推动行业向智能化、多元化方向加速演进。

版权声明:
作者:绘梦拾光
链接:https://www.diysq.com/?p=8163
来源:绘梦拾光原创
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>
文章目录
关闭
目 录