Sora是OpenAI推出的革命性视频生成模型,能以文字生成长达一分钟的高保真视频,被业界视为「世界模拟器」的雏形。
Sora于2024年2月震撼发布,展示了远超当时所有竞品的视频生成质量。其核心技术是Diffusion Transformer(DiT),将扩散模型与Transformer架构融合。Sora不仅能生成视频,还展现了对物理世界规律的初步理解——光影、运动、物体交互都相当真实。2025年正式向公众开放。
Sora不仅是视频生成工具,OpenAI将其定位为「世界模拟器」——通过理解物理世界的运行规律来生成视频。这种技术路线如果持续进化,将可能用于自动驾驶仿真、机器人训练等更严肃的工业场景。Sora代表了AI「理解世界」的一步跨越。