今年 2 月,OpenAI 推出了 Sora 文本到视频生成模型。通过提供描述视频场景的文本提示,用户可以生成长达 60 秒的全动态视频。近日,谷歌推出了自己的AI视频生成模型“Veo”,该模型还支持文本到视频的创建,能够制作超过60秒的1080P视频,具有多种电影风格和增强的自然语言理解能力。
谷歌通过两条推文展示了Veo的能力。其中一条推文展示了一段视频渲染演示,展示了Veo生成的城市夜间场景、飞驰的汽车和白天的城市景观。另一条推文强调了Veo根据特定文本提示生成视频的能力。提示,“许多斑点水母在水下游泳。它们的身体是透明的,在深海中发光“,导致了几只斑点水母在海洋中滑行的视频,动作自然连续,光影清晰,没有明显的图像错误。

谷歌表示,使用 Veo 的创作者可以使用各种电影术语来实现所需的视觉效果,例如延时摄影和航拍风景,从而减少调整提示所花费的时间。此外,Veo还支持视频扩展功能。如果创作者对当前的视频长度不满意,可以让Veo自动延长视频,也可以添加提示生成更长的视频。
谷歌已经开通了试用频道,并计划在年内向部分用户提供测试版本。此外,谷歌还提到打算将一些Veo功能集成到YouTube的短视频模块中,尽管实现方法和具体效果尚不清楚。
相关文章
网友评论(共有 0 条评论)