此前,Hailuo 02就曾在社交媒体上被A16Z合伙人点赞,什么实力无需多言:
01、实测Hailuo 02:能“演杂技”的大模型,极端复杂物理表现带师!
效果可见,海螺完美理解了“充满力量感”与“动作流畅”的含义:“力量感”体现在助跑的冲刺速度、踏板的坚实有力;“流畅感”则体现在动作过渡的丝滑、轨迹的圆润、落地冲击力处理的从容。
更难得的是,Hailuo 02没有让力量感变成僵硬的肌肉堆砌,也没有让流畅感沦为轻飘飘,它中找到了那份独属于顶尖运动员的那份刚柔并济,呈现出令人信服的物理规律,背后是对复杂运动轨迹和动力学的理解。
让我想起了作家卡尔维诺在《看不见的城市》中,区分了两种“轻”:一种是羽毛的轻,一种是鸟的轻。随风飘荡是假的轻,而凭风高飞,才是真的轻,轻盈而充实。如今,AI也能理解这么复杂的东西了!
可见,整个视频节奏无比紧凑,镜头运动与机械体跳跃动作严丝合缝,产生强烈的速度感和视觉冲击力,画面中踏板在被踩中时刻的下坠晃动,体现了超绝的重力感应,机器人主角的伸展、摆动过程中,每个关节的震荡都是自然合理的,展现了对高速运动物体与复杂动态镜头进行实时协同生成的能力,不是单纯的角色运动加背景拖拽,而是空间关系、相对运动、镜头感知的精密配合。
对比同样一家头部厂商的产品,效果则没有那么丝滑,“五毛特效”和塑料感的味道浓厚,以及忽略重力的“拔地腾空”,背后反映的其实是指令理解的深度差异,以及材质、物理映射力与氛围的多重鸿沟。
这不禁让我想起早期视频模型常见的那种僵硬、生疏和“伪人感”,如今头号玩家不断努力下,已经和最初的效果有了天壤之别,向“理解真实世界物理规则”迈进了一大步,这种逼真的呈现,已经触碰到了高质量商业级视频制作的边线,精准狙击着内容生产深水区最顽固的痛点!
不止于此,在我最关心的指令遵循能力上,Hailuo 02的表现也是一绝。
结果可见,Hailuo 02能将激烈的动作、细微的情感和宏大的氛围一并爆发式呈现,理解我说的“悲壮史诗感”“中世纪骑士”“从俯拍急拉至面部特写”等关键词,呈现出电影工业级视听语言的精准执行能力。这是AI视频生成从“看”世界走向“理解”世界物理规则的关键里程碑。
此外,Hailuo 02还是个细节狂魔,既擅长捕捉自然伟力、剧烈动态,也精于捕捉和再现生命细微的、静谧的美好。
如我所愿,Hailuo 02复现了自然界中最具冲击力的动态美学,在极端表现、超大规模场景模拟以及动态光照等效果集成方面的一梯队实力,电影特效降本增效有救了!
大家还记不记得,在《哪吒之魔童降世》路演采访中,饺子导演分享了一件趣事,电影中有一场申公豹变身成豹子头的特效画面,他找外包公司的特效师磨了两个月,但始终达不到预期效果。最终,这位特效师因压力过大选择离职。然而,新找到的外包公司恰好就是他的新东家。无奈之下,特效师又花了数月时间完成了这个只有几秒钟的特效镜头。
输入指令“阴云笼罩的破败巨型工厂突发剧烈爆炸,橙红色火球急速膨胀,冲击波撕裂钢铁结构,慢镜头飞溅金属碎片与碎石,浓密黑烟呈环形扩散;烟尘中骤然亮起一对猩红机械眼,巨大机械巨龙轮廓破烟而出,液压关节发出低沉轰鸣;烟尘稍散,高细节机械巨龙全身亮相——冰冷厚重的金属装甲覆盖复杂齿轮,背部能量管散发蓝光,生锈液压关节带动巨躯站立,低角度仰视镜头突显其压迫感,背景是持续崩塌燃烧的工厂废墟。”
如今,AI已经发展到可以构建可信且动态的视觉奇观,这不仅解构了高成本、高风险、低效率的传统制作流程,更将视觉表达的想象力缰绳握在自己手里,从“预算”和“技术实现不了”中进一步解放!
除了技术实力强大外,成本与效率也是Hailuo 02此次的王牌,相比前代Hailuo,02版本并非小修小补,而是在架构层面进行了重构,设计了更高效的DiT架构。训练成本却没有飙升,效率却是惊人的:训练和推理效率各自提升了2.5倍,模型参数规模提升3倍、训练数据量翻了4倍!
去年以来,MiniMax就被称为国货之光,如今更是一周内多弹连发,从发布全球首个开源大规模混合架构的推理模型MiniMax-M1,到上线视频生成能力登顶全球第二的Hailuo 02,绝非偶然爆发,而是其在底层架构上长期深耕厚积薄发的必然结果。
MiniMax正以惊人的爆发力和持久的耐力,推动着整个国内视频生成大模型的赛道加速向前,如今,Hailuo 02展现的,已不仅是某个单点技术的突破,而是标志着AI视频生成正式迈入了新的阶段,从早期的“能看”到如今的“专业可用、成本可控”,从简单的场景复现到对复杂物理规则和叙事的理解与表达,有望大大拓展AI在影视创作、游戏开发、广告营销、虚拟体验等领域的想象空间和应用深度。
大道不孤,众行致远。不只是MiniMax,上文提到的榜单中,图生视频TOP5,中国模型傲据四席,是一个强有力的信号:
2025-06-22 13:50