Imagen 是 Google Research 提出的文本到图像扩散模型,结合大型语言模型文本理解与高保真图像生成,并引入 DrawBench 用于评估文生图能力。
Gen-2 是 Runway Research 发布的多模态视频生成系统,可用文本、图片或视频片段生成新视频,支持 Text to Video、Text + Image to Video、Image to Video 和风格迁移等模式。