如果说初代 Sora 的出现只是 OpenAI 试个水,那么 Sora 2.0 的升级则显得更具杀伤力:它不仅能生成高质量视频,还能自动配上与视频匹配的 AI 音频,让整个视频作品看起来更逼真、更完整。
与此同时,OpenAI 推出了一款同名的 iOS 应用 Sora,还内置了一个叫做“Cameo”的功能,用户可以将自己或朋友的形象插入 AI 视频里自由创作和编辑。当然,OpenAI 也特别强调了,其已采取严格的身份保护措施,防止未经许可的滥用。
除此之外,Sora 未来还将开放 API,允许第三方开发者将 Sora 2 集成进自己的视频编辑工具中,带来更多专业化和细粒度的创作能力。至于安卓用户,也不用担心——Sora 的安卓应用版本正在开发中。
亲眼见证了 Sora 2 的到来,不少人感叹:糟糕,这波是冲着短视频领域巨头抖音和 TikTok 来的,妥妥的“AI 版本的抖音”。
让人“真假难辨”的 Sora 2 生成视频
OpenAI 在官方公告中回顾了 Sora 的发展历程。
最初的 Sora 模型在 2024 年 2 月问世,当时的意义类似于 GPT-1 之于文本的作用:它是视频生成领域的开端,第一次让人真切感受到“这东西真的能用”。
随着算力提升,模型开始展现出一些基础但重要的能力,比如物体持久性——一个球滚出屏幕再回来时,仍然是同一个球。此后,Sora 团队一直专注于让模型具备更强的世界模拟能力。OpenAI 认为,这类系统对训练能够真正理解物理世界的 AI 至关重要。而要做到这一点,关键之一就是在大规模视频数据上进行预训练和后训练——相比语言模型,这方面的研究才刚刚起步。
在应用之外,OpenAI 还在开发 sora.com 的新功能,包括分镜工具,让创作者按镜头控制视频展开。据 OpenAI 介绍,这项功能预计几周内上线。Sora 2 的 API 也将在“未来几周”推出,让开发者将视频生成能力集成到自己的工具和编辑器中。
当前,Sora iOS 应用已可下载。用户可以在应用中注册,当账号可用时会收到推送通知。初期上线仅限美国和加拿大,后续会快速扩展到其他国家。收到邀请后,也可通过 sora.com 使用 Sora 2。
Sora 2 初期免费提供,设有相对宽松的限额让用户自由探索,但仍受算力限制。ChatGPT Pro 用户可以在 sora.com 使用实验性的更高质量 Sora 2 Pro 模型(很快也会在 Sora 应用中提供)。未来还会提供 API 接入。Sora 1 Turbo 仍然可用,用户的历史作品会保存在 sora.com 库中。
对于 Sora 2 的发布,OpenAI CEO Sam Altman 在个人博客中表示,Sora 是“ChatGPT 在创意上的时刻”,早期测试者发现 Cameo 功能非常吸引人,能增强互动体验。他也承认潜在风险:服务可能让人上瘾,也可能被用于欺凌。