百度推出视频生成模型UniVG 可处理各种文本和图像的组合输入

站长之家 2024-01-19 10:31:09新闻资讯
403

百度推出的UniVG是一款视频生成模型,其特点在于针对高自由度和低自由度两种任务分别采用不同的生成方式,以更好地平衡两者之间的关系。

UniVG.png

项目地址:https://huggingface.co/papers/2401.09084

项目演示页面:https://univg-baidu.github.io/

视频生成技术基于“扩散”原理的方法近来在学术和产业界引起广泛关注,并取得显著成就。然而,目前这一领域主要集中在单一目标或单一任务的视频生成上,例如根据文本、图片或它们的组合生成视频。但这样的方法并不能完全满足真实世界多变的应用需求。用户通常需要更灵活的输入方式,如单独使用图像或文本,或将二者结合起来。

为了解决这一问题,百度提出了UniVG,一种“统一模态视频生成系统”,能够处理各种文本和图像的组合输入。该系统重新定义了视频生成模型中的多项任务,将它们划分为“高自由度生成”和“低自由度生成”两大类。在高自由度视频生成方面,采用了“多条件交叉注意力”技术,以生成与输入的图像或文本语义高度一致的视频。而在低自由度视频生成方面,引入了“偏置高斯噪声”,这种方法相较于传统的完全随机高斯噪声更能有效地保留输入条件的原始内容。

技术性能方面,UniVG在MSR-VTT视频数据库上表现出色,获得了最低的帧间视频差异性度量(Frame Video Distance, FVD)。这一成绩不仅超越了当前的开源方法,还与业界领先的闭源方法Gen2不相上下,显示出了卓越的实用价值和技术优势。

百度
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

百度站长平台提交SITEMAP报"索引型不予处理"的原因及解决方法
在使用百度站长平台提交Sitemap时,不少站长会遇到“索引型不予处理”的提示,导致网站页面无法正常被百度收录。这一问题常常让人困惑,究竟是什么原因导致Sitemap被拒绝?又...
2025-09-08 站长之家
587

百度站长平台抓取异常报524错误的原因及解决方法
524错误属于HTTP状态码中的服务器错误,具体表现为“A timeout occurred”(发生超时),这表明百度蜘蛛(Baiduspider)在尝试抓取网站页面时,服务器未能及时响应,导致抓取...
2025-09-04 站长之家
604

数据驱动运营:站长如何通过百度统计/Google Analytics优化网站?
作为国内主流的流量分析工具,百度统计与Google Analytics(GA)凭借多维度的数据采集能力,成为站长优化网站的核心武器。本文站长工具网将从工具对比、核心功能解析及实战策...
2025-07-29 站长之家
540

Java 调用百度地图天气查询接口获取当前与未来天气数据详解
本文将详细介绍如何使用 Java 调用百度地图天气接口,包括接口申请、参数构造、HTTP 请求发送以及 JSON 数据解析等完整流程,帮助开发者快速实现天气数据的集成。
2025-07-07 编程技术
490

OmniAvatar:阿里巴巴开源的一款音频驱动全身视频生成模型
OmniAvatar是由阿里巴巴夸克团队开源的一款音频驱动全身视频生成模型,旨在解决现有虚拟人技术中动作生硬、口型同步精度不足、缺乏全身自然交互等问题。该项目通过结合多层次...
2025-06-26 新闻资讯
797

百度站长平台提交网站地图后却不收录?掌握这3个隐藏技巧轻松解决
​提交网站地图后,百度却迟迟不收录?这是许多网站运营者常见的困扰。事实上,除了简单提交地图外,还有更多隐藏技巧可以帮助提升收录率。本文站长工具网将为您揭秘三大实用...
2025-06-20 站长之家
548