Sora 的“正式发布”,算是 AI 在内容生成领域迈出了重要的一步。虽然目前它还无法完全满足我们的期望。如果你和我一样对 Sora 充满好奇,不妨去 GPT 官网亲自体验一番!
Hello,大家好,我是 Sunday。
这两天在 GPT 的官网上看到了一个新的选项卡 Sora。
图片
说起 Sora 可能很多同学不是很了解,但是这个东西在当年第一次露面时,也是震惊了一大批人的!
那么,这一次它的“公开”亮相,也是让我想要赶紧“尝尝鲜”,不过最终体验的结果却是有点“哭笑不得” 😂
什么是 Sora?
Sora 是 OpenAI 推出的 文本生成视频模型。顾名思义就是 可以通过文字的描述来直接生成视频内容的工具
它第一次公开露相是在 24年2月份,当时我还写了对应的文章 太炸了!OpenAI深夜发布【文字直接生成视频!】含 Sora 技术报告分析~ 。当时的 Sora 还是倾向于各种演示场景,类似于一个“概念车”。
那么这一次 OpenAI 针对 Sora 的“正式”发布,可以理解为 Sora 终于“量产了”!
Sora 的核心能力
量产的 Sora 主要具备以下三类功能:
• 文本生成视频:根据用户输入文本的描述,可生成相应的视频片段,Pro 用户可生成长度可达 20 秒,分辨率最高支持 1080p。Plus 用户可生成长度为 5 秒,分辨率为 720P 的视频
• 图像动画:将静态图像转换为动态视频。
• 视频混合与编辑:用户上传自己的视频素材,使用 Sora 进行增强、混合或重新编辑。
如何使用 Sora
目前,Sora 已集成到 ChatGPT Plus 和 Pro 订阅中,我们无需额外付费即可使用!
以我订阅的 ChatGPT Plus 为例,可以直接生成 清晰度为 720P,长度为 5 秒的视频
图片
有点迫不及待了!
那么接下来就让咱们一起来试试看 Sora 是不是有传说中的那么神奇。
现在,我在输入框中输入:生成一段与海贼王大战超人的视频,双方对战非常激烈!(注意:目前并不支持上传照片生成视频)
图片
等待一会,咱们来看看它生成的视频质量如何…
图片
大约 20 秒的等待之后,视频即可生成,咱们来看看,这个视频是不是我们想要的 0.0
图片
哈哈哈,这是什么?
这两个人,我不说大家应该认不出来这是海贼王和超人吧,并且他们的打斗也毫无打斗的激烈感可言。
我本来期待着 Sora 能带给我们一段震撼的战斗场景,毕竟这是一个宣传的那么牛逼的文字生成视频的模型,怎么说也得“有模有样”吧?
然而,实际生成的视频却有点令人哭笑不得了……
目前 Sora 的局限性
Sora 确实是一个极具潜力的工具。但是仅从这次的体验来看,它目前的局限性还是非常明显的。
像我们刚刚输入的复杂场景描述,Sora 似乎难以理解或精准还原。目前生成的视频 更适合简单的场景,比如“清晨的海滩”或“天空中飞翔的鸟儿”。
同时,针对 GPT Puls 用户而言,生成的最长视频只有 5秒,分辨率也是有 720P。对于需要长时间叙事的场景,这显然还不够。
并且,Sora 对多角色、复杂情节的处理能力还有待提高。比如我们的“海贼王大战超人”,目前生成的视频甚至无法表现出明确的对应的人物特征。
写在最后
Sora 的“正式发布”,算是 AI 在内容生成领域迈出了重要的一步。虽然目前它还无法完全满足我们的期望。
如果你和我一样对 Sora 充满好奇,不妨去 GPT 官网亲自体验一番!
同时,我也想知道,假如 Sora 已经非常强大,可以生成任意你想要的视频了,那么 你最想生成怎样的视频呢?
来源 :程序员Sunday