谷歌发布视频生成模型(Lumiere):运动幅度和一致性表现良好

站长之家 2024-01-24 15:43:41新闻资讯
428

Lumiere是谷歌发布的第三个视频生成模型,这次的模型演示视频质量非常高,运动幅度和一致性表现也很好。除了视频生成,该模型还支持各种视频编辑和生成控制能力。

Lumiere 是一款先进的模型,专门用于将文本转换为视频,这在视频合成领域是一大挑战。为了实现这一目标,谷歌采用了一种创新的空间-时间 U-Net 架构。

Lumiere.png

项目地址:https://huggingface.co/papers/2401.12945

这种架构能够一次性完成整个视频时长的生成,与传统视频模型不同。传统模型通常是先合成关键的远程帧,然后通过时间上的超级分辨率技术来处理,这种方法难以保持视频的全局时间连贯性。

Lumiere 通过在空间和关键的时间维度进行上下采样,并利用预先训练好的文本到图像扩散模型,使得该模型能够直接生成全帧率、低分辨率的视频,并且在多个空间-时间尺度上进行处理。

该模型在将文本转换成视频方面取得了领先成果,并证明了该设计能够轻松应用于各种内容创作和视频编辑任务,包括将图像转换为视频、视频修补和风格化视频创作。

谷歌
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

谷歌支持加密货币矿企交易:AI算力大战背后的机会与风险
最近,谷歌母公司Alphabet搞了个大动作。他们支持加密货币矿企Cipher Mining的交易。这事挺轰动。我刷推特时看到消息,第一反应是:哇,科技巨头真下场了。以前矿企总被骂浪...
2026-04-02 新闻资讯
171

谷歌称破解比特币资源减少20倍!2029年前不行动,钱包真可能被rekt
大家好啊,我是老K。混币圈七年了。今天聊个重磅消息。谷歌刚发研究。说量子计算机破解比特币加密变简单了。资源需求大减20倍。市场居然没崩。比特币还涨了点。这事得说透。...
2026-04-02 新闻资讯
136

莱特币创始人李启威:从谷歌工程师到加密货币先驱
他是谁? 莱特币创始人叫李启威,英文名Charlie Lee。他是美籍华人,毕业于麻省理工学院。曾任职于谷歌公司。这段经历很关键。他在谷歌工作期间接触到了比特币。这直接启发...
2026-04-02 新闻资讯
112

能进谷歌的都是什么人
能进谷歌的人,通常具备几个硬核特质。我结合权威资料,给你拆解清楚。 技术硬实力是门槛 谷歌筛人,技术能力排第一。他们要的是顶尖计算机科学家、算法工程师或数据科学家。...
2026-04-02 新闻资讯
86

Huma Finance创始人深度解析:谷歌老将如何破局PayFi赛道
大家好,我是老K。混迹币圈七年,踩过钱包坑,也帮粉丝搞定过交易所注册。今天聊聊Huma Finance创始人。这个项目最近声量不小,但很多人只知其名,不知其人。说白了,团队背...
2026-04-02 新闻资讯
180

AMP是什么意思?谷歌AMP使用方法详细指南
AMP 是谷歌开源的一种网页框架,旨在帮助网页实现秒开加载,尤其适用于新闻资讯、博客、电商产品页等内容型网页。本文站长工具网将为你详细介绍 AMP 是什么、它的核心原理、如...
2025-08-29 站长之家
774