OpenAI最新推出的Sora是一款视频生成人工智能模型,其工作方式类似DALL-E和OpenAI的图像生成工具。用户可以输入所需场景,Sora将返回一个高清视频片段。Sora还可以根据静态图像生成视频片段、扩充现有视频或填补缺失帧。
Sora是基于谷歌研究人员在2017年提出的Transformer架构构建的扩散式人工智能模型。OpenAI表示,“Sora为理解和模拟现实世界的模型奠定了基础”。目前,Sora只能生成一分钟或更短的视频。微软支持的OpenAI正在开发多模态人工智能套件,其中包括将文本、图像和视频生成结合起来的功能。
此外,OpenAI正在构建一个用于识别由Sora生成的视频的“检测分类器”,并计划在其输出中包含元数据以帮助辨识人工智能内容。这与Meta在今年大选期间推出的人工智能图像元数据类型相似。
目前,只有小部分安全测试人员使用Sora进行测试,在错误信息和偏见等方面的漏洞方面发挥作用。该公司表示,相关技术论文将在周四晚些时候发布。
除了Sora外,Meta于今年初推出了Lumiere,与OpenAI和谷歌等公司竞争视频生成AI工具市场。其他初创公司也提供了类似的人工智能工具,例如Stability AI的稳定视频diffusion产品和服务。
最近,OpenAI在其官方网站上展示了几个由Sora生成的视频片段,包括"东京雪景"、"黄金时代"和"咖啡馆船只"等等。