近日,YouTube频道WVFRM Podcast邀请了OpenAI旗下备受瞩目的文生视频模型Sora的核心团队成员参与访谈,详细探讨了该模型当前的发展阶段及未来计划。在访谈中,Sora项目负责人Bill Peebles、Tim Brooks和Aditya Ramesh明确表示,目前Sora仍处于反馈获取阶段,短期内不会向公众开放。
Sora,这款由OpenAI发布的创新型人工智能文生视频大模型,自公布以来便引起了业界的广泛关注。它不仅能够根据用户提供的文本提示创建出长达60秒的逼真视频,更在深度模拟真实物理世界方面展现出惊人的能力。其工作原理是通过分析大量视频数据,学习并生成高度逼真的视频内容,这一过程中融合了GPT等大语言模型及DALL-E等扩散模型的技术。
然而,尽管Sora在技术上取得了显著的进展,但团队负责人强调,目前它仍处在不断完善的阶段,并不是一个成熟的产品。他们正在积极收集用户反馈,以便对模型进行进一步优化。关于何时将Sora推向市场,团队负责人表示目前尚无法给出明确的时间表。
在谈到Sora的训练数据来源时,负责人保持了一定的谨慎,仅透露它是基于公开可用的数据以及OpenAI授权数据的组合进行训练的。这一做法旨在确保模型在保持创新性的同时,也符合数据使用的合规性要求。
尽管Sora在视频生成领域展现出了强大的潜力,但业内人士也对其局限性表示了关注。电影概念艺术家和插画师Reid Southen指出,尽管AI工具在视频制作方面取得了一定的进步,但它们仍无法完全替代人类创作者的工作。好莱坞的制作流程非常复杂,而目前的AI视频生成工具在时间一致性、额外肢体等方面仍存在瑕疵。
尽管如此,Sora作为OpenAI在文生视频领域的重要尝试,其未来发展仍值得期待。随着技术的不断进步和团队的不断优化,相信Sora将在未来为我们带来更多惊喜和可能性。同时,我们也期待更多业内专家和爱好者能够关注并参与到Sora的反馈和改进过程中来,共同推动这一领域的发展。