AI视频工具

Sora

OpenAI 发布的首个文生视频模型 Sora

标签:
1AiBox AI社群

从文字(ChatGPT)到图片(DALL·E )再到视频(Sora),对OpenAI来说,仿佛在搜集一张张的拼图,试图通过影像媒介形态彻底打破虚拟与现实的边界,成为电影“头号玩家”一般的存在。

Sora

Sora 是一个 AI 视频模型,输入文字就能生成一个以假乱真的纯 AI 原创视频。除此之外,你还可以输入图片转成视频,用视频再转成新的视频……

Sora

相比竞品,Sora 是“灭霸”级别。之前主流的 AI 生成视频都在 4 到 16 秒,还“卡成 PPT”,而 Sora 弯道超车,直接将时长拉到 60 秒。后者的画面表现,已经媲美视频素材库,放进视频当空镜完全可行。Sora彻底与AI视频赛道的RunwayPika等公司拉开了一个段位。

Sora多机位视频生成

Sora

 

Sora自然融合两种完全不同的视频

Sora

 

Sora图片转视频

Sora

 

Sora特性

  • 准确性和多样性:Sora可将简短的文本描述转化成长达1分钟的高清视频。它可以准确地解释用户提供的文本输入,并生成具有各种场景和人物的高质量视频剪辑。它涵盖了广泛的主题,从人物和动物到郁郁葱葱的风景、城市场景、花园,甚至是水下的纽约市,可根据用户的要求提供多样化的内容。另据Medium,Sora能够准确解释长达135个单词的长提示。
  • 强大的语言理解:OpenAI利用Dall·E模型的recaptioning(重述要点)技术,生成视觉训练数据的描述性字幕,不仅能提高文本的准确性,还能提升视频的整体质量。此外,与DALL·E 3类似,OpenAI还利用GPT技术将简短的用户提示转换为更长的详细转译,并将其发送到视频模型。这使Sora能够精确地按照用户提示生成高质量的视频。
  • 以图/视频生成视频:Sora除了可以将文本转化为视频,还能接受其他类型的输入提示,如已经存在的图像或视频。这使Sora能够执行广泛的图像和视频编辑任务,如创建完美的循环视频、将静态图像转化为动画、向前或向后扩展视频等。OpenAI在报告中展示了基于DALL·E 2和DALL·E 3的图像生成的demo视频。这不仅证明了Sora的强大功能,还展示了它在图像和视频编辑领域的无限潜力。
  • 视频扩展功能:由于可接受多样化的输入提示,用户可以根据图像创建视频或补充现有视频。作为基于Transformer的扩散模型,Sora还能沿时间线向前或向后扩展视频。
  • 优异的设备适配性:Sora具备出色的采样能力,从宽屏的 1920x1080p 到 竖 屏 的1080×1920,两者之间的任何视频尺寸都能轻松应对。这意味着Sora能够为各种设备生成与其原始纵横比完美匹配的内容。而在生成高分辨率内容之前,Sora还能以小尺寸迅速创建内容原型。
  • 场景和物体的一致性和连续性:Sora可以生成带有动态视角变化的视频,人物和场景元素在三维空间中的移动会显得更加自然。Sora 能够很好地处理遮挡问题。现有模型的一个问题是,当物体离开视野时,它们可能无法对其进行追踪。而通过一次性提供多帧预测,Sora可确保画面主体即使暂时离开视野也能保持不变。

Sora的应用场景

  • 社交媒体短片制作:内容创作者快速制作出吸引人的短片,用于在社交媒体平台上分享。创作者可以轻松地将他们的想法转化为视频,而无需投入大量的时间和资源去学习视频编辑软件。Sora还可以根据社交媒体平台的特点(如短视频、直播等)生成适合特定格式和风格的视频内容。
  • 广告营销:快速生成广告视频,帮助品牌在短时间内传达核心信息。Sora可以生成具有强烈视觉冲击力的动画,或者模拟真实场景来展示产品特性。此外,Sora还可以帮助企业测试不同的广告创意,通过快速迭代找到最有效的营销策略。
  • 原型设计和概念可视化:对于设计师和工程师来说,Sora可以作为一个强大的工具来可视化他们的设计和概念。例如,建筑师可以使用Sora生成建筑项目的三维动画,让客户更直观地理解设计意图。产品设计师可以利用 Sora 展示新产品的工作原理或用户体验流程。
  • 影视制作:辅助导演和制片人在前期制作中快速构建故事板,或者生成初步的视觉效果。这可以帮助团队在实际拍摄前更好地规划场景和镜头。此外,Sora还可以用于生成特效预览,让制作团队在预算有限的情况下,探索不同的视觉效果。
  • 教育和培训:Sora 可以用来创建教育视频,帮助学生更好地理解复杂的概念。例如,它可以生成科学实验的模拟视频,或者历史事件的重现,使得学习过程更加生动和直观。

如何使用Sora

OpenAI Sora目前暂未提供公开访问使用的入口,该模型正在接受红队(安全专家)的评估,只向少数视觉艺术家、设计师和电影制作人进行测试评估。OpenAI没有指定更广泛的公众可用性的具体时间表,不过可能是2024年的某个时间。

相关导航