Sora 来了,现实不存在了?

来自版块: 资讯
69
3

2022年末,OpenAI聊天机器人ChatGPT的面世无疑成为了引领人工智能浪潮的标志性事件,宣告了新一轮科技革命的到来。无论是聊天娱乐、教育学习,还是工作生产、医疗健康等领域,人工智能正以前所未有的速度渗透到我们 ...

2022 年末,OpenAI 聊天机器人 ChatGPT 的面世无疑成为了引领人工智能浪潮的标志性事件,宣告了新一轮科技革命的到来。无论是聊天娱乐、教育学习,还是工作生产、医疗健康等领域,人工智能正以前所未有的速度渗透到我们生活的方方面面。

而就在 2 月 16 日,OpenAI 宣布推出全新的生成式人工智能模型 "Sora"。据了解,通过文本指令,Sora 可以直接输出长达 60 秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。

这意味着,继文本、图像之后,OpenAI 将其先进的 AI 技术拓展到了视频领域。OpenAI 亦表示,Sora 是能够理解和模拟现实世界的模型的基础,这一能力将是实现 AGI(通用人工智能)的重要里程碑。

对于 OpenAI 视频生成模型的出现,业内其实早有预期,但仍有人评价称 " 比想象中来得更快 ",亦有人振奋地表示" 我们真的看到新工业革命来临 "。

2 月 16 日,业内分析人士对《每日经济新闻》记者表示,Sora 无疑是人工智能领域的一次重大突破,该技术不仅展示了 AI 在理解和创造复杂视觉内容方面的先进能力,而且对内容创作、娱乐和影视制作行业带来了前所未有的挑战和机遇。

内容创作领域开启新纪元

确保内容真实透明成重要问题

2021 年初和 2022 年末,OpenAI 分别推出了图像生成系统 DALL · E 和聊天机器人 ChatGPT。这也使得 AI 逐渐成为各行各业辅助工作的工具,也正逐渐改变人们对未来工作的看法。

据介绍,Sora 是基于过去对 DALL · E 和 GPT 的研究基础构建,利用 DALL · E 3 的重述提示词技术,为视觉模型训练数据生成高描述性的标注,因此模型能更好的遵循文本指令。

Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。不仅了解用户在提示中要求的内容,还了解这些东西在物理世界中的存在方式。同时,该模型对语言有深刻的理解,使其能够准确地解释提示并生成表达生动情感的引人注目的角色。

对于 Sora 的面世,工信部信息通信经济专家委员会委员、数字经济专家刘兴亮称,这标志着 AI 技术在内容创作领域的一个新纪元。" 通过简短的文本提示或一张静态图片,Sora 能够生成持续一分钟左右的 1080P 高清视频,涵盖多个角色、不同类型的动作和背景细节等,几乎达到了电影级别的逼真场景。这种能力不仅为内容创作者提供了前所未有的工具,使他们能够以更低的成本和更快的速度将创意变为现实,而且为观众带来了更丰富和多样化的视觉体验。技术创新的这一巨大飞跃,预示着 AI 在未来人类生活的各个方面都将发挥更加重要的作用。" 刘兴亮表示。

而 Sora 以文字为核心的提示,将能够形成更加符合人类观念的连续视频,该模型的出现无疑将会对人们现有工作方式进行再一次迭代,同时也会对传统行业转型提出新的挑战。

生成式 AI 过去已积累了不少图像、声音等素材,并通过不断学习形成了更为成熟的算法。因此,若是可以通过 AI 在计算机中创建视频素材,或许将对影视行业产生重大影响。

刘兴亮称,AI 生成的视频可能减少了对人类演员、导演和其他创意角色的需求,从而影响到这个行业的就业。此外,随着 AI 技术的进步,传统的影视制作流程和商业模式也可能面临重塑。

不过,刘兴亮指出,这种转型并不意味着传统影视行业的消亡,而是需要与 AI 技术融合,探索新的艺术形式和表达方式。

实际上,自生成式 AI 出现以来,该技术一直在大肆 " 入侵 " 影视制作的全流程,由人工智能产出的内容也越来越普遍。

去年由哈里森 · 福特主演的《夺宝奇兵》第五部中,就利用 AI 技术让观众看到 40 年前青年时的福特;Netflix 网飞也在同年推出了由 AIGC 参与制作的动画短片《犬与少年》。

刘兴亮同时提到,随着 AI 生成内容与现实之间的界限变得越来越模糊,如何确保内容的真实性和透明性成为了一个重要问题。此外,版权、隐私和数据安全等问题也需要得到妥善解决。社会必须面对这些挑战,通过制定相关政策、法律和伦理准则来确保技术的健康发展,同时保护个人和社会的利益不受侵害。

拉大产业竞争差距

AI 生成视频技术或将进入爆发期

正如刘兴亮所说,AI 视频技术的诞生面临着一系列的问题。而除了对现实世界的影响,作为刚刚面世的全新技术,Sora 也存在不足之处。

对于 Sora 当前存在的弱点,OpenAI 指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

Sora 生成的视频中可能会出现不符合物理原理的场景,比如这个人正在反向跑步。

图片来源:OpenAI 官网

以此次发布的 DEMO" 与中国龙一起庆祝农历新年的视频 " 为例,Sora 无法准确生成视频画面中的中文受到了网友的关注。有相关人士对此调侃道:" 莫非是中文太难了?"

但是任何事件的发生都是从无到有,再从有到精的过程。据悉,Sora 如今正面向部分用户开放,以评估关键领域的潜在危害或风险。同时,OpenAI 也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。OpenAI 提前分享研究进展,旨在与 OpenAI 以外的人士合作并获取反馈,让公众了解即将到来的 AI 技术新篇章。

OpenAI 表示,他们正在教 AI 理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。

而相比于其自身缺陷,该技术的广泛前景更为外界所关注。

近两年,由于人工智能发展迅速,以至于很多企业纷纷加大了对人工智能的投入。科技创业公司研究机构 PitchBook 估计,2023 年全球生成式 AI 的市场规模将达 426 亿美元,2026 年则将达到 981 亿美元,未来增长动能可期。

随着生成式人工智能的市场潜力不断地被挖掘,大大小小的竞争对手开始浮出水面。

当前,参与该赛道的企业不乏亚马逊、微软、谷歌、百度、阿里等众多互联网巨头,也包括 Runway 等初创企业。

有行业人士指出,随着 Sora 的发布,OpenAI 在行业的领先程度立即加大,会将大家紧追的距离再度拉开一大截。未来,解决了人物一致性问题之后,AI 生成视频将大踏步前进,AI 视频或进入大爆发期。

记者 |熊嘉楠 可杨

编辑|王月龙 杨夏 盖源源

校对 |刘思琦

|每日经济新闻 nbdnews 原创文章|

未经许可禁止转载、摘编、复制及镜像等使用

每日经济新闻


路过

雷人

握手

鲜花

鸡蛋
看帖是喜欢,评论才是真爱:

全部回复(3)

我要评论
2024-2-18 09:02

热文

  • 3 天
  • 7天
返回顶部