AI音频模型Audiobox:通过语音和自然语言提示生成音频

站长之家 2023-12-01 10:19:55新闻资讯
33

Meta最新发布了Audiobox,这是一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示,Audiobox可以轻松生成各种声音,包括语音、音效和音景,从而为多种用例提供定制音频。

Audiobox是Voicebox的继任者,进一步推动了音频生成领域的发展。与Voicebox相比,Audiobox具有更强大的可控性,用户可以使用文本描述提示来指定语音和音效的风格,这是Voicebox不支持的功能。通过同时使用语音输入和文本提示,用户可以实现自由形式的语音重塑,这在当前的模型中尚属首次。

Audiobox.png

这款模型的独特之处在于,它允许用户使用自然语言提示描述他们想要生成的声音或语音类型。例如,如果有人想要生成一片音景,他们可以给模型一个文本提示,如“一条奔流的河流和鸟儿的鸣叫”。

Audiobox不仅在语音生成方面表现出色,还在音效生成方面表现出色。经过内部测试,Audiobox在质量和相关性方面明显超过先前的最佳模型,并在主观评估中以超过30%的样式相似性优势击败了Voicebox。

为了促进领域的发展并确保研究的负责任性,Meta计划邀请研究人员和学术机构申请资金,用于Audiobox的安全和责任研究。这一举措反映了他们对AI创新的关切,强调了与研究社区合作的重要性。

Audiobox的推出标志着音频生成领域的一项重要进展,Meta希望通过这一创新降低音频创作的门槛,使任何人都能轻松成为音频内容创作者。这对于视频、播客、游戏等多种用例都具有潜在的影响,为未来的音频创作开辟了新的可能性。

ai
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Adobe Express 应用全新升级,AI 驱动的创作工具让设计更简单
Adobe公司于10月9日发布博文,宣布对Express应用进行重大更新,旨在改善Creative Cloud集成,加速和扩展企业创作品牌内容,提升团队、机构和合作伙伴之间的协作效率。Adobe E...
2024-10-12 新闻资讯
111

17岁高中生开发AI应用爆火!6个月狂揽700万
随着AI技术的火爆,一位年仅17岁的高中生Zach Yadegari凭借其开发的AI应用Cal AI,在今年9月份的时候实现了超过100万美元(约合706万元人民币)的收入。当时Zach Yadegari在社交...
2024-10-09 新闻资讯
115

iPadAir6怎么截图?iPadAir6截图方法汇总
iPadAir6 作为苹果公司推出的一款平板电脑,具备强大的功能和便捷的操作体验。截图是日常使用中经常会用到的功能,无论是用于记录重要信息、分享有趣的内容还是用于工作和学习...
2024-10-05 电脑知识
153

美图公司旗下AI短片创作工具MOKI正式对所有用户开放使用
美图公司近日宣布,其开发的AI短片创作工具MOKI正式对所有用户开放。用户现在可以登录MOKI官网体验这一创新工具,享受前所未有的视频创作体验。MOKI是市场上独树一帜的视频创...
2024-09-27 新闻资讯
121

AI代码生成器(Cursor)安装和使用详细教程
随着人工智能技术的不断发展,越来越多的工具被应用于软件开发领域。其中,AI代码生成器(Cursor)因其能够自动生成代码、提高开发效率而受到广泛关注。本文将详细介绍Cursor的...
2024-09-14 编程技术
132

夸克自主研发AI智能对话助手CueMe正式上线:支持2万字长文创作
近日,夸克宣布其自主研发的AI智能对话助手 CueMe 正式对外发布,为用户带来全新的智能写作体验。它具备多项卓越的特性。其中,最为引人瞩目的是其支持 2 万字长文创作的能力...
2024-09-12 新闻资讯
132