腾讯发布多模态音乐生成模型M2UGen 支持图片、视频生成音乐

站长之家 2024-01-03 10:52:09新闻资讯
176

M2UGen是一款引领潮流的框架,融合了音乐理解和多模态音乐生成任务,旨在助力用户进行音乐艺术创作。通过其强大的功能,M2UGen提供了全方位的音乐生成和编辑体验。

M2UGen.png

体验地址:https://crypto-code.github.io/M2UGen-Demo/

除了可以从文字生成音乐外,它还支持图像、视频和音频生成音乐,并且还可以编辑已有的音乐。该项目利用了MERT等编码器进行音乐理解,ViT进行图像理解,ViViT进行视频理解,并使用MusicGen/AudioLDM2模型作为音乐生成模型(音乐解码器)。用户可以轻松移除或替换特定乐器,调整音乐的节奏和速度。这使得用户能够创造出符合其独特创意的音乐作品。

此外,M2UGen还加入了适配器和LLaMA2模型,使得该模型具备多种能力。

据悉,M2UGen采用了创新的方法,生成了大规模的多模态音乐指导数据集,用于训练模型。这包括MU-LLaMA模型生成的1.2k多小时音乐字幕数据集。模型结合了MU-LLaMA、BLIP图像字幕模型、MPT-7B-Chat模型以及VideoMAE字幕模型,以在各个领域生成对应的指导。

M2UGen展示了其出色的音乐生成、理解和编辑能力,用户可以通过交互式的演示视频和文本生成演示体验到模型的强大潜力。从生成摇滚音乐到对图像进行音乐创作,M2UGen满足了用户的多样化需求。

ai
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

腾讯游戏信用分怎么查?腾讯游戏信用分查询方法详解
对于腾讯游戏玩家而言,游戏信用分是衡量账号健康度的重要指标,直接影响游戏体验、社交互动甚至账号权益。然而,许多玩家对信用分的查询方式、评分逻辑及提升策略仍存在疑问...
2025-05-08 电脑知识
359

ACE-Step:ACE Studio 和 StepFun开源的音乐生成基础模型
ACE-Step 是一个革命性的开源音乐生成基础模型,旨在通过其全面的架构设计克服现有方法的局限性,并在音乐生成领域实现最先进的性能。该项目由 ACE Studio 和 StepFun 共同领...
2025-05-07 新闻资讯
288

​DeepMind发布Lyria2 音乐生成模型,革新AI音乐创作
Google DeepMind正式发布其最新音乐生成模型Lyria2,标志着人工智能在音乐创作领域的又一重大突破。这一全新模型通过高保真音频生成和专业级音质,为音乐家、制作人和创作者提...
2025-04-26 新闻资讯
275

YuE:开源AI音乐生成模型,根据歌词生成完整的歌曲和伴奏
YuE 是一个由香港科技大学(HKUST)和多模态艺术投影(M-A-P)团队共同开发的开源 AI 音乐生成基础模型。它的名字在中文中意为“音乐”和“快乐”,寓意着通过技术让音乐创作...
2025-03-31 新闻资讯
388

腾讯云宣布上线DeepSeek最新版V3模型API接口
3月25日晚,腾讯云宣布率先上线DeepSeek-V3-0324版本模型的API接口,企业和开发者可以通过腾讯云直接调用这一最新版模型,获得稳定且优质的服务。同时,腾讯云旗下大模型知识...
2025-03-26 新闻资讯
292

Hunyuan3D 2.0:腾讯公司开发的高分辨率3D资产生成模型
Hunyuan3D 2.0是一个由腾讯公司开发的先进的大规模3D合成系统,专注于生成高分辨率的纹理3D资产。这个系统由两个核心组件构成:一个是大规模形状生成模型——Hunyuan3D-DiT,...
2025-03-19 新闻资讯
286