网站导航

新闻资讯 编程技术 电脑知识 站长之家 自媒体

腾讯发布多模态音乐生成模型M2UGen 支持图片、视频生成音乐

站长之家 2024-01-03 10:52:09新闻资讯

296

M2UGen是一款引领潮流的框架，融合了音乐理解和多模态音乐生成任务，旨在助力用户进行音乐艺术创作。通过其强大的功能，M2UGen提供了全方位的音乐生成和编辑体验。

体验地址:https://crypto-code.github.io/M2UGen-Demo/

除了可以从文字生成音乐外，它还支持图像、视频和音频生成音乐，并且还可以编辑已有的音乐。该项目利用了MERT等编码器进行音乐理解，ViT进行图像理解，ViViT进行视频理解，并使用MusicGen/AudioLDM2模型作为音乐生成模型(音乐解码器)。用户可以轻松移除或替换特定乐器，调整音乐的节奏和速度。这使得用户能够创造出符合其独特创意的音乐作品。

此外，M2UGen还加入了适配器和LLaMA2模型，使得该模型具备多种能力。

据悉，M2UGen采用了创新的方法，生成了大规模的多模态音乐指导数据集，用于训练模型。这包括MU-LLaMA模型生成的1.2k多小时音乐字幕数据集。模型结合了MU-LLaMA、BLIP图像字幕模型、MPT-7B-Chat模型以及VideoMAE字幕模型，以在各个领域生成对应的指导。

M2UGen展示了其出色的音乐生成、理解和编辑能力，用户可以通过交互式的演示视频和文本生成演示体验到模型的强大潜力。从生成摇滚音乐到对图像进行音乐创作，M2UGen满足了用户的多样化需求。

ai

本文来源于#站长之家，由@tom 整理发布。如若内容造成侵权/违法违规/事实不符，请联系本站客服处理!

该文章观点仅代表作者本人，不代表本站立场。本站不承担相关法律责任。

如若转载，请注明出处：https://www.zhanid.com/news/421.html

THE END

tom

不图事事圆满但图事事甘心。

相关推荐

HunyuanVideo-Foley：腾讯混元团队开源的一款端到端视频音效生成模型

HunyuanVideo-Foley：腾讯混元团队开源的一款端到端视频音效生成模型

HunyuanVideo-Foley 是腾讯混元团队研发并开源的一款端到端视频音效生成模型，其核心使命是通过人工智能技术，为无声视频自动生成高质量、高同步的音效与背景音乐，打造真正意...

2025-08-29 新闻资讯

644

ToonComposer：腾讯、香港中文大学和北京大学联合开源的生成式AI动画制作工具

ToonComposer：腾讯、香港中文大学和北京大学联合开源的生成式AI动画制作工具

ToonComposer 是由中国香港中文大学、腾讯PCG ARC实验室和北京大学研究人员联合开发的一款革命性生成式AI动画制作工具，它通过创新的"生成式后关键帧"技术（Generative Post-...

2025-08-22 新闻资讯

789

AutoCodeBench：腾讯混元团队开源的全自动生成多语言代码评测基准数据集

AutoCodeBench：腾讯混元团队开源的全自动生成多语言代码评测基准数据集

一、AutoCodeBench是什么AutoCodeBench 是由腾讯混元团队提出的一个全自动生成高难度多语言代码评测基准的开源项目，旨在解决传统代码评测基准依赖人工标注、语言覆盖有限且...

2025-08-21 新闻资讯

468

WeKnora：腾讯开源的的模块化文档理解与智能检索框架

WeKnora：腾讯开源的的模块化文档理解与智能检索框架

WeKnora（中文名"维娜拉"）是腾讯公司开源的一款基于大语言模型的新一代文档理解与检索框架，专为解决结构复杂、内容异构的文档场景中的智能问答需求而设计。

2025-08-08 新闻资讯

797

MixGRPO：腾讯混元团队开源的图像生成框架

MixGRPO：腾讯混元团队开源的图像生成框架

MixGRPO 是腾讯混元团队开源的一项突破性的图像生成框架，通过融合随机微分方程（SDE）与常微分方程（ODE）的混合采样策略，在文本到图像（Text-to-Image, T2I）生成任务中实...

2025-08-06 新闻资讯

490

ARC-Hunyuan-Video-7B：腾讯开源的多模态短视频理解与生成模型

ARC-Hunyuan-Video-7B：腾讯开源的多模态短视频理解与生成模型

ARC-Hunyuan-Video-7B 是腾讯ARC实验室于2025年7月开源的多模态大模型，专注于现实世界短视频的结构化理解与生成。该模型以端到端方式融合视觉、音频和文本信号，具备多粒度时...

2025-08-01 新闻资讯

571

推荐工具

热门网站

热门文章

1 ed2k下载工具有哪些：8款广受好评的ed2k下载工具推荐 2 打开浏览器显示空白页about:blank怎么办？ 3 下划线“_”怎么打？电脑中下划线符号输入方法详解 4 Windows11系统中获取帮助的9种方法详解 5 网页打不开提示“CONNECTION_RESET”的原因及解决方法 6 Word顶端有一条横线怎样删除？删除Word顶部横线的几种方法

图文资讯

图片压缩软件有哪些？5款免费好用的图片压缩软件推荐

软件下载

Cursor
下载
Cursor 是一款创新的AI代码编辑器...
Maye Lite
下载
Maye Lite是一个专注于文件快速...
微信开发者工具
下载
微信开发者工具是一款专门针对于...
图吧工具箱
下载
图吧工具箱是电脑系统和硬件维护...
ShareX
下载
ShareX是一款免费的开源程序，不...
HeyGem
下载
Heygem 是一款专为Windows系统设...