期待越大,失望越大。OpenAI 的 Sora 就这样在万众瞩目中姗姗来迟,历经 10 个月终于露出真容。热情的用户们蜂拥而至,甚至一度让服务器不堪重负,甚至到目前都无法注册。然而好景不长,这个月费高达 200 美金的”重磅产品”很快就在网络上饱受诟病,甚至被指不如一个中国开源模型。讽刺的是,与国外用户的差评如潮形成鲜明对比的,是国内自媒体们几乎异口同声的溢美之词。这场AI视频革命,似乎并没有像预期那样惊艳四座。来看看一些国外推友是怎么骂的。图:部分国外推友的对 SORA 的评论先说说虚幻引擎之父 Tim Sweeney 发布的这个趣味表情包。这已经说明了很多问题,对吧?:-)”你不过是用 GeForce 显卡训练了一个预测像素的模型,却说这是个能模拟真实世界的系统。”OpenAI 官方展示的精彩内容与用户实际体验之间存在巨大差距,一位用户分享了他作为 SORA Alpha 测试者的体验。尽管他能免费无限制地使用该产品,但他认为 SORA 的生成效果很差,而且随时间推移变得更糟。他将 SORA 与 Midjourney 做对比,认为后者能带来更好的用户体验和成就感。他认为中国的模型更好,而 SORA 的失败原因在于版权限制,并预测未来 AI 电影的突破会来自游戏领域的 AI 和 3D 技术结合,而不是当前的扩散模型方案。来自 SORA Alpha 测试员的评论当 @PurzBeats 和 @blizaine 等用户尝试复现 Sora 宣传视频中的提示词时,得到的结果简直判若两物,这让人怀疑我们用的是不是同一个模型。为此他们也进行了疯狂的吐槽,甚至专门做了一期视频发到 Youtube 上,标题就是“Sora:还没准备好”,他的槽点非常具体明确:估计只有 Pro 版才值得订阅(需要 200$/月)Plus 版(20$/月)甚至连人物视频都不能生成画面中除了主体之外的动作都显得很生硬且不连贯对提示词的执行效果很差,特别是在处理动作和镜头移动时价格贵得离谱本人在昨天发的文章里面进行了类似的吐槽,这里仍然要做个补充,Plus 版本不仅不能生成人物,而且只能生成 720p 的视频,关键下载还不能去水印。MKBHD(Marques Brownlee)是一位超级大 V,在 Youtube 上有近 2000 万粉丝,他对 SORA 进行了全面的评测分析。最后他认为 SORA 在视频清晰度和地标场景生成方面表现出色。但他指出Sora一个明显的短板是对物理规律的处理仍然不够理想。因为模型对视频中的物体缺乏真正的”理解”,所以经常会出现一些”幻觉”现象,比如物体运动违反常理,或者忽然消失又出现,他给了一些失败的示例:SORA 出品的起飞的犀牛,来自@MKBHDSORA 出品的6 个手指,来自@MKBHD 并且他认为Sora缺乏类似 Kling(快手可灵)/Runway 的动态绘画界面,使得图片转视频功能难以精确控制。体操仍然是 AI 视频的图灵测试,Sora 一样扑街:SORA 生成的体操运动,来自 @deedydas价格当然也是大家疯狂吐槽的一个点:Pro 版要 200 美元一个月 (这还是唯一值得考虑的版本)。Plus 版基本无人问津。720p 分辨率限制,每月仅 50 次生成机会。这分明就是披着消费级产品外衣的企业级技术。你可能不明白 50 次生成机会是什么概念。假设一部 2 分钟短片,每个镜头 5s,也就是至少需要 24 个镜头,正常来说我们剪辑至少要用到 30-50 个镜头(因为有的镜头可能会要更短)。而这个 50 次生成机会,乐观估计也只有 60%是成功的,也就是说最多 30 个镜头,刚刚好能完成一个 2 分钟的短片。但我还是要提醒下,为此你花了 140 块钱,得到了 720p 的视频,而且带水印。没有对比就没有伤害,差不多生成数量的国产模型,都在 60 元/月(人民币)左右,不仅是 1080p 的,而且下载还去水印,更关键的是质量、功能都比 SORA 更胜一筹。快手可灵的价格SORA 也支持图生视频,但一样很糟糕。@Erik 反馈这个模型本身的表现还不如 @Kling_ai、@Hailuo_AI 或 @runwayml,尤其是在图像转视频 (I2V) 方面。主要问题是经常出现幻觉和莫名其妙的错误,逼得你不得不一遍遍重新生成。模型生成的动作往往很快,但这些动作通常显得很怪异且不连贯。这简直就是一个 meme,来自@Erik作为一个资深玩家,这位外国朋友还不忘给我们做了一个总结。我心目中视频模型的排名依然差不多:大多数场景首选 Kling 1.5(国产:快手可灵)动态镜头找 Minimax (国产:MINIMAX 海螺 AI)视频转视频和镜头控制用 Runway关键帧制作选 LumaSora?也许只适合尝试一些实验性的、不可预期的动作故事板重混(storyboard remixing)和变体混合( variant blending)等创新功能确实很吸引人。但这些只是在不稳固的基础上添加的 UI 创新,就像在摇摇欲坠的地基上建豪宅一样。主流视频 AI 工具的 CEO 们松了口气,因为 Sora 展示的功能并无实质性突破。连腾讯的免费模型都能胜过大多数 Sora 的生成效果。图:@Bilawal Sidhu所发 SORA 和腾讯混元的对比不仅如此,这些外国网友都盛赞中国的视频模型。他们认为中国在 AI 视频领域的优势主要来自三个方面:数据、人工标注和劳动力资源。中国拥有数量更多、教育水平更高的标注人员,他们进行大规模精细标注,持续提升模型质量 — 这在图像转视频任务中尤其明显。最后一个因素是:各机构在模型训练和推理上的投入意愿。虽然后者美国似乎更有优势,但如果质量始终比不过中国,这优势还有意义吗?历史似乎总在重复上演。就像当初 ChatGPT 的光环逐渐被其他产品追赶甚至超越,以及 ChatGPT Search 昙花一现般的失败,Sora 似乎也难逃这个宿命。OpenAI 仿佛陷入了一个怪圈:擅长制造轰动效应,却在产品深耕方面屡屡掉链子。有趣的是,某些自媒体却仍在延续着他们一贯的”国外月亮更圆”的论调——当他们对 Sora 的种种缺陷视而不见时,却对国内同类产品吹毛求疵。这不禁让人想起那句老话:练就一双慧眼比盲目跟风要难得多。在 AI 这个快速迭代的领域,或许我们更需要的是理性的声音和客观的评判,而不是人云亦云的追捧或者意气用事的贬低。© AI范儿要进“交流群”,请关注公众号获取进群方式投稿、需求合作或报道请添加公众号获取联系方式往期推荐憋了10个月,OpenAI终于发布了Sora,但早被国产超越!点这里👇关注我,记得标星哦~点个在看你最好看
暂无评论...