Meta推AI视频模型(Fairy):轻松替换视频人物、改变风格

站长之家 2024-01-08 13:37:29新闻资讯
325

Meta 的 GenAI 团队推出了名为 Fairy 的视频到视频综合模型,该模型比现有模型更快,时间上更一致。研究团队展示了 Fairy 在几个应用中的表现,包括角色 / 物体替换,风格化和长形式视频生成。

比如,只需简单的文本提示,如 “仿梵高风格”,就足以编辑源视频。例如,文本命令 “变成雪人” 将视频中的宇航员变成了雪人。

Fairy.png

Fairy2.png

Fairy 的视觉连贯性是一个特别具有挑战性的问题,因为基于相同提示有无数种方法可以修改给定的图像。Fairy 使用交叉帧关注机制,这是一种隐式传播扩散特征的机制,确保了优越的时间连贯性和高保真度的合成。

Fairy3.png

该模型可以在仅14秒内生成大小为512x384像素、120帧(30fps 下的4秒)的视频,比以前的模型至少快44倍。与 Meta 的 Emu 视频模型一样,Fairy 是基于用于图像处理的扩散模型,经过了视频编辑的增强。

Fairy 在处理源视频的所有帧时不进行时间降采样或帧插值,并保持了512的水平输出视频的纵横比。在使用六个 A100GPU 进行测试时,Fairy 能够在71.89秒内渲染一个27秒的视频,并保持高度的视觉一致性。

Fairy 的性能在一个包含1000个生成样本的广泛用户研究中进行了测试。无论是人类判断还是定量指标都证实,Fairy 的表现优于 Rerender、TokenFlow 和 Gen-1这三个模型。

Fairy4.png

然而,该模型目前在处理如雨、火灾或闪电等动态环境效果方面存在问题,这些效果要么无法很好地融入整个场景,要么会产生视觉错误。

尽管存在这些问题,研究团队认为他们的工作在 AI 视频编辑领域代表了一次重大进展,具有对时间一致性和高质量视频合成的变革性方法。

Fairy项目体验网址:https://fairy-video2video.github.io/

ai
THE END
蜜芽
故事不长,也不难讲,四字概括,毫无意义。

相关推荐

MetaStone-S1:融合深度推理与过程评分的反射生成模型
MetaStone-S1 是北京元石科技推出的反射生成式大模型,其核心创新在于提出了"反思型生成范式"(reflective generative paradigm),通过统一框架实现了推理生成与过程评估的协同...
2025-07-09 新闻资讯
587

FairyGen:开源AI自动化动画生成系统,轻松将儿童手绘草图转化为卡通动画视频
FairyGen是一个基于AI技术的自动化动画生成系统,它能够将儿童手绘的角色草图自动转化为风格一致、剧情驱动的卡通动画视频。与传统的动画制作工具不同,FairyGen只需用户提供...
2025-07-01 新闻资讯
430

V-JEPA 2:Meta AI开源的视频理解与机器人规划世界模型
V-JEPA 2(Video Joint Embedding Predictive Architecture 2)是Meta AI研究团队于2025年6月推出的第二代世界模型框架,作为首个基于视频训练的自监督学习系统,它实现了从视...
2025-06-13 新闻资讯
756

Loopy:字节跳动开发的一款音频驱动的AI视频生成模型
Loopy是由字节跳动和浙江大学联合开发的一款基于音频驱动的AI视频生成模型。它能够将静态照片或图像转化为动态视频,使照片中的人物能够根据输入的音频文件进行面部表情和头部...
2025-01-31 新闻资讯
1016

Meta标签生成器:在线自定义HTML网页Meta标签的便捷工具!
在网站开发和搜索引擎优化(SEO)领域,Meta标签是提升网站可见性和用户体验的关键元素。站长工具网提供的Meta标签生成器是一款便捷的在线工具,它允许用户轻松自定义HTML网页的...
2024-12-26 新闻资讯
411

Leffa:Meta AI开源的可控人物图像生成框架
Leffa,全称为Learning Flow Fields in Attention,是Meta AI推出的一个用于可控人物图像生成的开源框架。它基于注意力机制和流场学习,能够精确控制人物的外观(如服装、配饰...
2024-12-23 新闻资讯
702