在开发出爆款聊天机器人ChatGPT系列之后,OpenAI继续在生成式人工智能上玩出了“新花样”。2月16日,OpenAI推出了新的AI大模型Sora,据称该文生视频大模型能够通过快速文本提示,创建出逼线秒视频,视频的效果相较之前又上了一个台阶。
据了解,该大模型的优势在于不仅能够更好地理解用户在提示中的要求,还能够理解这些东西在现实世界中的存在和运动方式。OpenAI表示,“正在教人工智能理解和模拟运动中的物理世界”,目标是训练模型来“帮助人们解决需要现实世界互动的问题”。
随后,OpenAI还解释了Sora的工作原理,表示Sora作为一个扩散模型,会从类似于静态噪声的视频开始,通过多个步骤逐渐去除噪声,使视频由最初的随机像素转化为清晰地图像场景,而此前大火的Midjourney和Stable Diffusion的图像和视频生成器同样基于扩散模型,但Sora能够通过让模型一次预见多帧画面,确保了即使被摄体在离开视线后仍然能保持不变,也使其展示出了对电影拍摄语法的自发理解。
一位视频工作者在看到Sora之后表示,“我进入YouTube世界已经15年时间,但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了,素材网站将变得无关紧要,任何人都可以无壁垒获得难以置信的产品,内容背后的‘想法’和故事将变得更加重要。”
不过,也有不少人在看了Sora生成的视频之后表示:画面很真实,但也很诡异。这其实是由该大模型的缺点决定的。虽然该模型能够在一定程度上模拟现实场景,但仍然难以准确模拟复杂场景中的物理现象,也无法理解具体的因果关系,还存在混淆提示的空间细节等诸多问题果木园林景观盆栽网站。
此外,关于文生视频模型安全性方面,OpenAI表示,正在开发帮助检测误导信息的工具,以此来检查例如极端暴力、性内容、仇恨图像、名人肖像等违反使用政策的文本提示,确保它在显示给用户的内容中没有违反使用政策的内容。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
效果炸裂!OpenAI首个视频生成模型发布,1分钟流畅高清,网友:整个行业RIP
谷歌Gemini 1.5深夜爆炸上线,史诗级多模态硬刚GPT-5!最强MoE首破100万极限上下文纪录
国能神东煤炭2023招录1228人,内科大121人,听说每年有20万+
《咒术回战:双华乱舞》评测:谁买我会笑话谁/
主站 商城 论坛 自运营 登录 注册 《咒术回战:双华乱舞》评测:谁买我会笑线...果木园林景观盆栽网站果木园林景观盆栽网站果木园林景观盆栽网站