Meta 的 AI 研究团队推出了 Movie Gen 模型,旨在为创作者提供媒体生成工具。Movie Gen Video 是一个拥有 300 亿参数的 transformer 模型,可以通过单一文本提示生成图像和视频。Movie Gen Audio 则是一个 130 亿参数的模型,能够根据视频输入和可选文本提示生成音频,包括环境音、背景音乐和拟音效果。此外,Movie Gen 支持视频编辑和个性化视频生成,能够根据文本指令进行局部或全局的编辑。
Movie Gen 模型的技术实现基于 transformer 架构,支持从文本到视频、视频编辑、以及视频到音频的多种转换功能。用户体验方面,Meta Movie Gen 提供了操作界面和生成速度,使得创作者能够快速实现创意构思。在创意产业中,Movie Gen 的应用前景包括广告、影视制作和社交媒体内容创作等领域。