Google Gemini的超强演示视频是”作弊“的！

发表于 2023-12-08

标记狮私有云部署

一键部署标记狮至私有服务器，构建快速，安全，高效，私密的UI设计团队云协作

Google Gemini的超强演示视频是”作弊“的！2.jpg

这两天Google新推出的多模态AI系统Gemini引爆了行业,成为了科技界的关注焦点。为宣传这款“旗舰”级产品,Google发布了一段“亲身体验Gemini”的视频,展示Gemini与用户进行各种高级互动的场景:从涂鸦绘出鸭子、回答语音问题,到识别手势游戏、重新排序行星草图等等。

这段视频迅速走红,观看次数短短一天内就突破百万。许多观众对Gemini灵活的语音语义理解和视觉理解能力印象深刻。纷纷觉得它超越了ChatGPT4V。

但就在大众对Gemini赞不绝口时,一些更细心的网友开始发现视频中的种种蹊跷。这些最令人眼前一亮的Gemini“表演”,看起来竟几乎都是“剪辑”出来的!

比如在视频的2分45秒处,Gemini仅通过观察几个手势,就立即识别出对方正在玩“石头剪刀布”游戏,表现出人类般的直觉反应。

但查看Gemini的官方文档就会发现,Gemini根本无法单从个别手势推理出这个游戏,

Google Gemini的超强演示视频是”作弊“的！5.jpg

它需要同时看到整套的“石头、剪刀、布”手势,也就是三个手势要同时出现，并且还要告诉Gemini这是一种游戏，才有可能作出正确回答。

再如后判断行星顺序的场景,视频中只是简单地摆放了三个行星草图,Gemini就给出了正确顺序。

Google Gemini的超强演示视频是”作弊“的！4.jpg

但文档中透露,提问时还特意给了“考虑它们与太阳的距离”这样的提示,但视频中却完全省略了这一点。

其他诸如追踪杯子里的球等互动,文档同样显示Gemini需要提前训练,但视频只展示了效果。

可以说,视频通过有选择地“过滤”真实场景,故意塑造出Gemini更具自主理解能力的虚假印象,夸大了它的技术实力。即便视频开头就提示过进行了剪辑,但“亲身体验”这样的标题无疑让普通观众误解这就是Gemini的真实水平。

对此,Google的说法是视频呈现了Gemini的真实输出,只对其做了小量编辑。但看过文档的网友很快指出,视频与文档中展示的完全就是两种互动形式,前者根本不存在,是后者的“美化版”。

Google通过精心制作的“作假”视频来夸大新产品实力，让大家误以为它的多模态能力已经超越了ChatGPT4V!目前看来Gemini的真实能力还需要再继续做判别了。