OpenAI首个视频生成模型发布 一句话生成1分钟高清视频

快科技 2024-02-16 10:24:12新闻资讯
204

2月16日消息,OpenAI日前发布首款文生视频模型Sora模型,完美继承DALLE 3的画质和遵循指令能力其支持用户输入文本描述,生成一段长达1分钟的高清流畅视频。

该模型可以深度模拟真实物理世界,标志着人工智能在理解真实世界场景,并与之互动的能力方面实现了重大飞跃。

官方公布的生成视频现实,以中国龙年春节为提示词生成的视频中,熙熙攘攘的人群中,有人在舞龙,舞龙动作相当丝滑标准,还有人举起手机拍摄,场景细节丰富、严谨。

另一段都市丽人”漫步东京雨后街头视频中,路面上的水渍倒影细节逼真,霓虹灯光影效果堪比实景,如果不是标注说明,很多人意识不到这是由AI生成的视频片段。

OpenAI表示,技术团队正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。

OpenAI.png

根据文本提示生成视频,仅仅是整个计划其中的一步。

目前Sora已经能生成具有多个角色、包含特定运动的复杂场景,不仅能理解用户在提示中提出的要求,还了解这些物体在物理世界中的存在方式。

不过,Sora当前也存在局限性,OpenAI称其可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。

该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

即便如此,OpenAI的首个视频模型发布后,不少网友惊呼:不少人要丢工作了”、整个素材行业可能都会因此衰落”、语言大模型后,OpenAI又要一次加快AI进化”。

目前已有一些视觉艺术家、设计师和电影制作人(以及OpenAI员工)获得了Sora访问权限,他们也已开始不断Po出新的作品,为人们展示AI生成视频的无限创意可能。

下附OpenAI视频模型Sora官网:https://openai.com/sora

OpenAI
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

ContentV:字节跳动开源的一款高效文本到视频生成模型
ContentV是字节跳动研发的一款高效文本到视频生成模型,其核心创新在于通过极简架构改造和流匹配训练策略,实现了在有限计算资源下训练80亿参数大模型的目标。该项目针对当前...
2025-06-11 新闻资讯
309

MoviiGen1.1:基于Wan2.1微调的开源电影级视频生成模型
MoviiGen1.1是由ZulutionAI团队开发的开源视频生成模型,基于Wan2.1框架微调而成,专注于电影级视觉质量的输出。该模型通过11位专业电影制作人和AIGC创作者的60项美学维度评估...
2025-05-23 新闻资讯
345

OpenAI达成收购初创公司Windsurf:30亿美元交易创AI领域收购纪录
生成式AI领军企业OpenAI近日宣布,已与人工智能编程工具开发商Windsurf达成最终收购协议,交易估值约30亿美元。这是OpenAI成立以来的最大规模收购案,标志着这家估值超3000亿...
2025-05-06 新闻资讯
380

OpenAI重组计划被迫改变:非营利实体继续主导,营利部门转型为公益公司
当地时间5月5日,人工智能研究机构OpenAI宣布调整其重组计划,明确将继续由非营利性母公司掌控公司治理,同时推进营利性部门的结构优化。这一决策是在与加州及特拉华州总检察...
2025-05-06 新闻资讯
308

Magi-1:Sand-AI开源的大规模自回归视频生成模型
MAGI-1是一款基于自回归算法的大规模视频生成模型,旨在通过预测一系列视频块(chunks)来生成高质量视频。它能够根据文本指令或图像输入生成连贯且逼真的视频内容,同时支持...
2025-04-23 新闻资讯
436

Codex:OpenAI开源的轻量级终端运行AI编程智能体
Codex是由OpenAI开发的一个开源项目,它是一个能够在终端运行的轻量级AI编程智能体。该智能体旨在为开发者提供一种便捷的方式来利用OpenAI的技术进行代码相关的操作,包括但不...
2025-04-18 新闻资讯
510