导演、音乐家、艺术家眼中的Sora第一印象
自从2月16日Sora发布的那个夜晚以来,多少人都在翘首以盼,期待能真正的用上Sora。但是OpenAI自己也懂,基于模型对齐问题、安全问题、推理算力问题等等,这玩意短期内,基本不可能放出来给大众用。当然了,等以后能够开发给大众使用的时候,鉴于它所需要的算力,一定是远超ChatGPT的,所以肯定会给PLUS用户使用,关于如何升级PLUS,可以查看这个教程.
为了维持热度,OpenAI天天在Tiktok上放一点新视频,来维持Sora的热度。
但是无一例外的是,这些视频,大部分都是他们自己生成的。并且,大部分的视频,审美都不太行。
但是刚刚有个好消息是,OpenAI 宣布,自2月份推出文生视频工具Sora以来,他们始终在与视觉艺术家、设计师、创意人士以及电影制作人等各界精英展开合作,共同探讨Sora如何助力他们的创作之旅。
OpenAI在官方声明中提到,尽管Sora仍有诸多方面有待完善,但他们已经目睹了这个模型如何神奇地将创意人员的构想转化为生动逼真的现实画面。
当你不复制旧的东西,而是将我们本来没有机会看到的新的、不可能的想法变为现实时,Sora 的力量最为强大。
- 保罗·特里罗,导演
虽然我们对 Sora 还需要进行许多改进,但我们已经了解到该模型如何帮助创意人员将想法变为现实。
尽管 Sora 擅长创造看似真实的事物,但令我们兴奋的是它能够创造出完全超现实的事物。
- Shy kids
以下是部分艺术家精心创作的作品,以及他们对于Sora如何融入他们的工作流程和业务模式的初步见解。
1.《气球头》,Shy kids
总部位于加拿大多伦多的Shy kids是一家多媒体制作公司,他们借助Sora成功制作了一部关于气球人的短片。这部短片由沃尔特·伍德曼(Walter Woodman)、西德尼·利德尔(Sidney Leeder)以及帕特里克·塞德伯格(Patrick Cederberg)三位创作者联手完成。
**2.保罗·特里罗(Paul Trillo),导演**特里罗是一位多才多艺的艺术家、作家及导演,其作品赢得了《滚石》与《纽约客》等权威媒体的赞誉。他的作品已经19次被列入Vimeo员工精选,这是对他在Vimeo平台上制作的最优秀短片的高度认可。
谈及Soa对他的影响,特里罗说:“使用Sora,我第一次感受到了作为电影制作人的无限自由。它让我摆脱了时间、金钱以及他人许可的束缚,使我得以大胆创新,以前所未有的方式进行构想和实验。”他的实验视频正是这一创作理念的生动体现,他称:“当你不再局限于复制旧有的事物,而是能够借助Sora将我们从未有机会一窥的崭新、超乎想象的理念变为现实时,那种力量是最震撼人心的。”3.尼克·克莱维洛夫(Nik Kleverov),Native Foreign的创意总监
Native Foreign是一家坐落于加州洛杉矶的创意公司,通过专注于品牌叙事、动作和标题设计,以及领先的生成式人工智能工作流程,荣获了艾美奖的提名。作为公司的联合创始人兼创意总监,克莱维洛夫巧妙地运用Sora这一工具,“将抽象的概念具象化,为品牌合作伙伴迅速迭代创意”,从而打破了传统预算限制对创意叙事的束缚。
克莱维洛夫分享了他的使用体验:“我习惯于在行动中思考,而当我使用Sora时,我真切地感受到了将任何奇思妙想转化为现实的无限可能。”
4.奥古斯特·坎普(August Kamp),艺术家、音乐家
坎普是一位音乐家、研究员、创意活动家和多学科艺术家,他对于Sora的评价充满了激动与期待。
她解释道:“Sora对我来说,无疑是一个里程碑式的转折点。作为艺术家,我长久以来都受到想象力和创作手段的束缚,视野难以拓展。然而,Sora让我能够直观地构建并迭代电影视觉效果,为我开启了一条崭新的艺术道路。现在,我迫不及待地想要一睹这些工具在未来会催生出怎样丰富多彩、别具一格的故事形式。”5.约瑟芬·米勒(Josephine Miller),创意总监
米勒是伦敦Oraar工作室的联合创始人兼创意总监,专注于3D视觉、增强现实和数字时尚的设计。
米勒说:“Sora真正挖掘出了我多年积累的想法的潜力,这些想法在过去由于技术限制一直未能实现。它让我能够以惊人的高质量迅速构思游戏,这不仅对我的创作过程构成了新的挑战,更帮助我在叙事技巧上取得了显著的进步。如今,我能够在更少的技术束缚下,将想象力转化为现实。”6.唐·艾伦·史蒂文森三世(Don Allen Stevenson III),数字AR/XR艺术家
唐·艾伦·史蒂文森三世是一位才华横溢的创作者、演讲家及顾问,其职业生涯起始于梦工厂动画。他跨越多个领域,与众多科技和娱乐公司紧密合作,深入探索混合现实(MR)、虚拟现实(VR)以及人工智能的应用。他说:“很长一段时间以来,我一直在制作增强现实混合生物,这些生物是我脑海中极富创意的组合。而现在,Sora的出现为我提供了更为简便的原型制作方法,使我能够轻松地将3D角色完全构建于空间计算机之中。”
唐·艾伦·史蒂文森三世对Sora的“怪异”特性尤为赞赏,认为这是其最大的优势所在。他解释道:“Sora不受传统物理定律或思维模式的束缚,这使得我在与其合作时,能够将注意力从繁琐的技术障碍中解脱出来,转而专注于纯粹的创造力。Sora为我打开了一个即时可视化和快速生成原型的世界,让我能够将更多的时间和精力集中在真正重要的地方,即塑造角色所期望的情感影响。”7.亚历山大·雷本(Alex Reben),雕塑家、艺术家、OpenAI的驻地艺术家
雷本是一位在艺术领域耕耘了十年的艺术家,始终在以其独特的视角探索人工智能中人性的幽默与荒谬。他致力于将人工智能生成的图像转化为现实世界中的3D雕塑,通过手工的方式让这些虚拟创作得以实体化。
谈及Sora的使用经验,雷本表示:“Sora为我提供了一个全新的起点,让我能够更深入地开发3D雕塑。在这一过程中,我的思考逐渐转向了摄影测量领域,以及它在雕塑制作中的潜在应用。特别是将视频转换为3D模型的前景,让我倍感兴奋。这不仅为我打开了新的创作思路,也预示着人工智能系统正逐步超越其原有的界限,展现出更为广阔的应用前景。”
Sora这么牛背后全靠算力撑着
Sora以其惊艳世界的视频场景生成能力而令人瞩目,然而,对于渴望运用该模型的艺术家们而言,其背后的算力需求可能并非易事。近期,Factorial Funds针对Sora的成本进行了详细预算,核心结论如下:
——Sora的训练过程需要庞大的算力支撑,预计每月将消耗4200至10500个英伟达H100 GPU的运算资源。
——每个英伟达H100 GPU的运算能力极限估计为每小时能够生成约5分钟的视频。与大语言模型相比,像Sora这样的基于扩散的模型推理成本要高得多,甚至高出几个数量级。
——随着类Sora模型的广泛应用,推理计算的需求将逐渐超过训练计算。这一“转折点”预计将在生成1530万至3810万分钟的视频时到来,此后,用于推理的计算量将超越原始训练所需的计算量。值得一提的是,目前每天上传至TikTok的视频高达1700万分钟,而YouTube则达到4300万分钟。
——假设TikTok(占据所有视频分钟数的50%)和YouTube(占据所有视频分钟数的15%)等流行平台的视频生成大量采用人工智能技术,并综合考虑硬件的利用率和使用模式,预计用于推理的峰值需求将达到约72万个英伟达H100 GPU。
总而言之,尽管Sora在视频生成的质量和能力方面取得了显著进展,但其背后的算力需求,尤其是GPU推理计算的需求,也可能随之大幅增加。