OpenAI首个视频生成模型发布 一句话生成1分钟高清视频

快科技 2024-02-16 10:24:12新闻资讯
40

2月16日消息,OpenAI日前发布首款文生视频模型Sora模型,完美继承DALLE 3的画质和遵循指令能力其支持用户输入文本描述,生成一段长达1分钟的高清流畅视频。

该模型可以深度模拟真实物理世界,标志着人工智能在理解真实世界场景,并与之互动的能力方面实现了重大飞跃。

官方公布的生成视频现实,以中国龙年春节为提示词生成的视频中,熙熙攘攘的人群中,有人在舞龙,舞龙动作相当丝滑标准,还有人举起手机拍摄,场景细节丰富、严谨。

另一段都市丽人”漫步东京雨后街头视频中,路面上的水渍倒影细节逼真,霓虹灯光影效果堪比实景,如果不是标注说明,很多人意识不到这是由AI生成的视频片段。

OpenAI表示,技术团队正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。

OpenAI.png

根据文本提示生成视频,仅仅是整个计划其中的一步。

目前Sora已经能生成具有多个角色、包含特定运动的复杂场景,不仅能理解用户在提示中提出的要求,还了解这些物体在物理世界中的存在方式。

不过,Sora当前也存在局限性,OpenAI称其可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。

该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

即便如此,OpenAI的首个视频模型发布后,不少网友惊呼:不少人要丢工作了”、整个素材行业可能都会因此衰落”、语言大模型后,OpenAI又要一次加快AI进化”。

目前已有一些视觉艺术家、设计师和电影制作人(以及OpenAI员工)获得了Sora访问权限,他们也已开始不断Po出新的作品,为人们展示AI生成视频的无限创意可能。

下附OpenAI视频模型Sora官网:https://openai.com/sora

OpenAI
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Allegro-TI2V:Rhymes AI开发的一款先进文本图像到视频生成模型
Allegro-TI2V是Rhymes AI开发的一款先进文本-图像到视频生成模型。它利用深度学习技术,将用户输入的文本提示和初始图像转化为连续的视频内容。Allegro-TI2V的发布标志着AI技...
2024-11-29 新闻资讯
122

字节跳动推出PixelDance与Seaweed视频生成模型:可在即梦AI平台免费体验
近日,字节跳动宣布推出两款全新的视频生成模型——PixelDance和Seaweed,并通过其即梦AI平台向公众免费开放使用。这一举措旨在助力设计师、影视制作人员及动画创作者等专业人...
2024-11-18 新闻资讯
139

OpenAI推出API中的结构化输出功能:开发者可定义JSON Schemas
​8月7日消息,OpenAI公司在2024年8月6日宣布了其API中的一个突破性新功能——结构化输出(Structured Outputs)。这项新功能确保了模型生成的输出将严格遵循开发者提供的JSO...
2024-08-07 新闻资讯
161

OpenAI推出SearchGPT:AI搜索引擎开启内测
人工智能领域的领先企业OpenAI于今日宣布,正式启动其AI搜索引擎SearchGPT的内测阶段。目前,SearchGPT仅向有限数量的用户开放,感兴趣的用户可以通过官网申请加入候补名单,...
2024-07-26 新闻资讯
142

OpenAI将阻断部分国家和地区API流量,国内AI企业推出替代方案
近日,OpenAI官方宣布,自7月9日起,将对来自非支持国家和地区的API流量进行阻断,这一决策直接影响了中国内地和中国香港的API服务使用。面对OpenAI的这一变化,国内AI企业迅...
2024-06-26 新闻资讯
115

OpenAI发布Mac版ChatGPT应用:面向所有用户开放下载
近日,OpenAI公司宣布一项重大更新,其备受期待的ChatGPT聊天机器人应用现已面向所有Mac用户开放下载。这款专为Mac操作系统设计的应用程序,标志着人工智能技术在用户日常交互...
2024-06-26 新闻资讯
97