“隆重介绍 Sora,我们的文本转视频模型。”当地时间2月15日,OpenAI突然发布首款文生视频模型——Sora,震惊程度可以让熬夜党们彻底清醒到睡不着觉,直呼“王炸来了”。
据OpenAI在社交平台X上发文,Sora 可以创建长达60秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。
目前OpenAI在官网上已经更新了Sora生成的48个视频demo,这些demo不仅准确呈现出指令细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。
例如一个Prompt(大语言模型中的提示词)的描述是:在东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。