新闻 发表于 2025-10-1 19:17

AI版抖音?Sora2最新实战深度测评!

作者:微信文章


各位小伙伴大家好,就在假期的第一天,Sora 2震撼发布!

小编先用一句话总结它的优点:

更真(物理世界更靠谱)、更稳(多镜头可控、状态持续)、更完整(声画同生、台词与音效同构)。而且,它不只是一套模型,还是一款全新的社交 App——Sora。

OpenAI 也同步上线了名为 “Sora” 的 iOS 社交应用。它把“生成—二创—社交”串成了一个闭环:

我们可以用文字直接生成短视频,也可以从图片出发做动画,或者对别人的作品一键 Remix。

相较于tik tok,它的信息流的目标不是“无限刷”,而是激发用户的再创作;推荐系统甚至支持用自然语言调整你的 feed 偏好。真正意义上的AI版抖音。
1、注册使用

目前App端只在美区的iOS 上线,且需要邀请码,这里小编放上一个邀请码供大家使用:D73DPJ

注册登录步骤按照下图所示:



收到邀请后,Web 端 sora.com 也可使用了。

接下来我们将从它几个重要的功能入手,为大家详细介绍Sora 2使用测评。
2、Cameo出镜秀

Sora 2这次最大的亮点就是它的“Cameo出镜秀”,类似于创造一个数字人,但步骤更简单。

只需要一分钟,录制一段自己的脸和三秒钟的声音,即可创建自己的形象,可随时调用。人物一致性保持得堪称完美。

山姆·奥特曼这两天已经被全世界网友给玩坏了~



给大家看看效果
在北京的街头,稳定器半身跟拍,路灯与人流虚化; @sama 面向镜头边走边说,结尾停步,镜头轻推。Sam 真诚地说:「大家好,我在北京。愿这座城的清风,吹到你的心里;也祝中国人民繁荣昌盛、阖家安康;我们一起用技术和想象,创造更美好的生活。」
@sama 在抖音跳舞直播,和美丽网红女主播们一起跳来财舞,收到钱以骞打赏,并说:“屏幕前你宝子们,双击666!老板大气!谢谢你们的火箭”,大家哈哈大笑!
在重庆风格街巷夜雨,霓虹反射,@sama 推门入店,蒸汽腾起,@sama 他说「大家好,我是 Sam,今晚兼职——火锅店店长。夜有点凉,但这里——只走热乎的人间。来,先把烦恼涮一下,幸福多夹两筷。祝你这一锅,红红火火、越煮越有味!」
这人物一致性,这口型,这神态语气,谁能看得出是AI?

那么上方的出镜秀形象角色具体是如何创建的呢?小编这里用手机给大家演示操作。



还可以进行多人互动。

小编以自己的形象创建了一个出镜秀角色,在提示词中点击本人的头像和山姆·奥特曼的头像,并输入简单的提示词:
@along与@sama在酒吧喝酒
本人验证,有至少九成的相似度~ 英文还说得这么溜。
3、Remix

Sora 2的另一个非常好玩的功能就是它的Remix功能。

简单来说,就是视频编辑。这个功能在runway、可灵等工具中很早就有了。

但开头介绍过了,Sora 2这次上线的App端可以说是想打造一个AI版的抖音,只要是用户上传的视频,都能一键进行编辑二创,这一招确实狠,一些时下流行的东西可以形成病毒式传播了。

比如说我刷到山姆奥特曼在超市里看5090显卡的视频,我想把产品进行改变。

只需要点击下方所示的圆形按钮,然后输入提示词:
把产品变成宝可梦娃娃




效果相当惊艳。仔细听,台词也变成了皮卡丘、宝可梦相关的介绍。

全程只需要输入一段中文提示词就完成了。
4、图生/文生视频

官方介绍说,Sora 团队一直专注于训练具有更高级世界模拟能力的模型。这样的系统对于训练深刻理解物理世界的 AI 模型至关重要。也十分谦虚地说明,这些数据还处于起步阶段。

他们表示,随着Sora 2 的推出,已经跳到了视频领域的 GPT-3.5 时刻。

Sora 2 能够做到以前视频生成模型难以做到甚至不可能做到的事情:奥运会的体操表演,冲浪板上的后空翻等复杂动作。

在此,我选取官方展出的素材,使用相同的提示词进行生成素材,来展开对比。
Prompt: a man does a backflip on a paddleboard 提示:一个人在冲浪板上做了个后空翻
Prompt: a gymnast flips on a balance beam. cinematic提示:一名体操运动员在平衡木上翻转。电影化
可以看到,实测结果确实不如官方展示得那么理想。对于复杂的物理运动,抽卡率还是高了一些,但小编觉得整个动作的“势”还是很到位的。但相比于1年多前的Sora 1,已经进步相当明显了。

在图生视频领域,它与veo3、kling2.5等主流视频模型相比,也还是存在一定差距。更不用说玩AI视频特别依赖的首尾帧以及多图参考等功能了。

这里拿之前制作的作品素材来横向对比,以男人骑马远行的图片来进行图生视频操作。

可以明显看出,Sora 2与其他模型相比没有什么优势。
镜头跟随着男人骑马向前穿梭,手自然地牵着马绳,周围的桃树和群山在不断后退。动态模糊。

但Sora 2这就这么一无是处吗?

错了!

它擅长跨多个镜头执行复杂指令,角色与环境的状态可以持续,并且能实现音画同步。

声画是一次性生成的:对白、环境声、音效与画面同步长出来,氛围不再全靠后期补救。对于短视频生产线,这是把“声音部门”直接前移到提示词阶段。

小编就上传一个我们西羊石的logo后,再输入以下提示词:
Create an AI video training advertisement for a company called "西羊石".
这效果太炸裂了。完美的中文配音,各分镜的自然的切换,流畅的剪辑以及前后保持得非常好的logo一致性。

除了少部分汉字有一点点缺陷之外,几乎可以直接拿来使用。

除此之外,小编还看到了非常多实用的用法。不论是做短剧、广告片、概念片、爆款短视频,统统轻松实现。

曾经的AI视频领域主流的"文、图、视、音、剪"工作流,好像真的要被一句简单的提示词给替代。

人人都能当导演的时代真的来了!
5、写在最后

Sora 2 让人真实地感觉到,那个“加速的时代”真的来了。

它不再是科幻片里的场景,而是你马上就能上手的工具。

震惊之后,更多的是兴奋:工具变强了,我们能玩的东西也更多了。

其实对待 AI,心态不妨放轻松点:别把它捧上神坛,也别自己吓自己。就把 AI 当作一个搭档,一个能帮你聚焦的放大镜,或是一台让你跑得更快的跑步机。

与其胡思乱想地焦虑,不如带着好奇心动手去试试。我们真正要做的,其实就三件事:搞明白“我想表达什么”,锻炼审美“为什么这个好”,以及持续动手“我怎么让它更好”。

愿我们被震撼时,能心怀敬畏;在兴奋时,也能冷静思考。别总等着“彻底看懂”,先用你清晰的判断和真诚的表达,做出点普通人的“不普通”来。

动手去做大片吧!也欢迎在评论区分享你的使用心得。


作者 | 阿泷 编辑 | 小石学长觉得有收获可以一键三连,转发给需要的小伙伴

推荐阅读

第一批不找工作的年轻人,靠AI半年赚几十万2024总结——顺势破局,把副业兴趣干成了事业!
2024总结——6个月,从大学生到年入百万公司老板2025,入局AI了!AI视频创业小作坊线下办公两个月,我们到底卷出了啥?
页: [1]
查看完整版本: AI版抖音?Sora2最新实战深度测评!