谷歌Cloud Next 2024丨Imagen 2视频生成能力不太理想

标记狮私有云部署
一键部署标记狮至私有服务器,构建快速,安全,高效,私密的UI设计团队云协作

Imagen 2_2.jpg

在本次Cloud Next 2024大会上,谷歌除了展示其云产品和服务,也难掩对生成式人工智能的高度重视。它宣布推出升级版Imagen 2,新增名为"实况图像"(Real-time Image)的视频生成能力,但与现有同类工具相比,这一功能的实际表现仍显不足。

作为Imagen图像生成模型的最新进化,Imagen 2可根据文本提示创作和编辑图像,而"实况图像"则允许用户输入文字描述,如"一只西伯利亚虎在雪地里奔跑",系统即可基于该提示生成4秒的动态GIF视频短片。谷歌将这项功能定位为营销人员和创意工作者的实用工具,有望替代一些成本较高的专业视频拍摄需求。

不过,与视频生成领域其他工具相比,Imagen 2"实况图像"的实际表现仍有一定差距。例如Runway公司的视频生成系统,不仅能生成长达18秒的高分辨率视频,而且支持用户自定义更多参数,内容形式更加丰富多元。就连OpenAI内部使用的新系统Sora,其生成视频的分辨率和细节程度都已达到近乎照片级别的质量。相较之下,Imagen 2目前"实况图像"的输出仅为360x640像素的低分辨率,的确显得有些单薄。

Imagen 2_4.png

为解决潜在的版权争议,谷歌表示Imagen 2采用了自家人工智能研究团队DeepMind开发的SynthID技术,在生成内容中嵌入了不可见的数字水印。理论上,即便对视频做任何修改,这些水印都能继续存在,从而确保内容的出处可查。不过检测这些水印需要使用谷歌提供的专有工具,公司并未采取开源的方式,这在一定程度上缺乏透明度。

Imagen 2的"实况图像"视频生成能力固然是一项创新尝试,但暂时还难以与Runway和OpenAI的视频生成系统分庭抗礼,还是期待一下谷歌在未来能否就"实况图像"功能推出更加出众的升级版本吧!

标记狮私有云部署
一键部署标记狮至私有服务器,构建快速、安全、高效、私密的UI设计团队云协作
立即部署>>
标记狮私有云部署-一键部署标记狮至私有服务器,构建快速,安全,高效,私密的UI设计团队云协作