创业公司OpenAI于2021年开发的人工智能(AI)视频生成器程序“Sora”走出研究阶段,以“Sora Turbo”的新名称正式对外发布,引起了轰动。
这项服务的推出在网上引发了用户的狂热,导致该公司在发现自己被雪崩般的流量淹没后,暂时停止了新账户的创建。
Sora使用文本提示来创建内容,类似于ChatGPT等其他内容创建程序。与产生书面回复的传统人工智能程序不同,Sora根据用户输入的文本制作高质量的视频。
苍井空太棒了,gj @sama
尽快将其添加到@everartai,以便您可以将您的图像带入生活pic.twitter.com/wMehxOc8cm
——Jay A (@jay_azhang), 2024年12月9日
根据OpenAI在12月9日发布的一份声明,Sora Turbo是对原始Sora程序的改进,因为它允许更快的视频创建,更高质量的视频和大量视频编辑功能,使用户能够剪辑和创建视频序列,并在保留视频其他部分的同时更改视频中的元素。
广告
那么Sora Turbo到底是什么?它将如何改变视频创作行业?
Sora和许多其他人工智能视频生成器的强大之处在于,它能够在极短的时间内用高质量的电影设备复制人类所能做的事情。
用户不仅可以给程序提示在视频中包含什么,还可以提示他们想要使用哪种类型的相机、镜头选择、灯光设置、视觉美学、构图和故事板。
使用这些细节的提示符示例如下:
“使用中长焦镜头(85毫米)捕捉夜间工作的街头小贩的亲密肖像。用小贩自己温暖、发光的摊位灯和背景中较冷的城市灯光来照亮场景。在小贩准备食物或商品时,注意他们手的细节,用他们富有表情的脸来平衡画面。这个形象应该唤起他们对自己手艺的努力和自豪感。”
它并不完美。
用户写一个文本提示,说明他们想要生成什么类型的视频,Sora就会创建视频。当前版本有一些限制。视频质量高达1080p,每秒30帧,长度只有20秒。
这是多媒体艺术家兼“卫星青年”(Satellite Young)乐队主唱草坂百代(Emi Kusana)制作的《Sora Turbo》视频的一个例子。“卫星青年”是一个灵感来自20世纪80年代的日本流行音乐和科幻主题的音乐团体,歌曲的主题来自20世纪80年代的时尚团体竹之子(Takenoko-zoku)。虽然有20秒的限制,但Sora故事板功能允许用户将多个人工智能生成的视频串在一起并按顺序排列,如下面的视频所示。
广告
一些视频中也出现了明显的错误。例如,在上面的视频中,在36秒的标记处,其中一个舞者做了一个180度的颈部旋转,当然这是人类不可能的,然后继续舞蹈。该公司表示,将不得不进一步努力解决这类漏洞。
在OpenAI创始人萨姆·奥特曼(Sam Altman)今年2月发布的一段女性做饭的视频中,观众会发现,在这位女性停止搅拌后,她右手的勺子消失了。
https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
——萨姆·奥特曼(@sama), 2024年2月15日
一些行业专家和创意总监担心苍井空可能会颠覆电影业,尤其是好莱坞。
今年3月,一位不愿透露姓名的好莱坞高管告诉半岛电视台:“我不认为这是对制作的威胁,而是对我们目前所知道的制作方式的威胁。”
他提到了过去后期制作方式的变化,比如人们开始在个人笔记本电脑上编辑视频,而不是付钱给后期制作公司来做这项工作。
他说:“很多人在这种转变中被淘汰了,而另一些人却突然负担得起一个合适的编辑,而无需支付邮局所需的日常开支。”
不,它不是。人工智能视频生成器市场每天都在增长。然而,Sora与其他竞争对手的一个明显区别是,Sora能够制作出无与伦比的视频质量和真实感。
广告
此外,这款名为Sora Turbo的新版本还配备了许多高级视频编辑功能,用户可以在Adobe Premiere Pro或Final Cut Pro上找到这些功能,这两款非常受欢迎的视频编辑软件用于电影、电视和在线内容创作。
此外,苍井空还得到了大型软件公司微软的资金支持。迄今为止,微软已投资近140亿美元,最近一次注资是1月23日的100亿美元。据美国全国广播公司财经频道(CNBC) 10月份报道,OpenAI目前拥有40亿美元的循环信贷额度,使其总流动性超过100亿美元。这笔投资为苍井空提供了许多其他竞争对手所没有的杠杆水平。
还有其他几个顶级AI视频生成器,包括:
据报道科技行业和风险投资行业的出版物The Information称,成立于2018年的Runway已经筹集了2.37亿美元的资金,据报道,该公司正在与风险投资公司General Atlantic进行谈判,以筹集4.5亿美元的新资金。免费版的Runway Gen 3可以生成10秒的视频片段,分辨率为720p,每秒30帧。对于付费用户,视频剪辑可以设置为1440p或2160p。
与Sora类似,它可以根据文本提示创建视频,但由于其在短视频项目中的高速和高效,它严重依赖社交媒体创作者和营销人员使用它来创建广告。
长篇人工智能生成视频的挑战之一是多个生成视频之间的一致性。较长的视频需要交互式提示改进,使所有视频的外观和感觉相同。
广告
Kling是一家总部位于北京的中国大型科技公司,由快手(在国际上也被称为Kwai)投资。Kling于2024年6月发布,并将自己定位为OpenAI的Sora等平台的竞争对手。Kling可以生成长达两分钟的视频,分辨率为1080p,每秒30帧。
中国人工智能初创公司MiniMax得到了阿里巴巴集团(Alibaba Group Holding)的支持,后者是一家总部位于中国的跨国公司,专门从事电子商务、互联网服务和技术服务,其最近一轮融资在3月份达到6亿美元。MiniMax成立于2021年,由香港沙田领先的人工智能公司商汤科技的前员工创建。
Minimax可以生成6秒的视频片段,分辨率为720p,每秒25帧。
有话要说...