谷歌发布寰球模子Genie 2！一键生成3D游戏，东谈主和AI齐能玩

栏目分类

奇闻探索: 趣味新闻; 娱乐趣事; 生活小贴士; 奇闻探索

热点资讯

为何好意思国左近热武器

首批队伍1小时上岛？台军

胡塞抵抗好意思军，中国

你的位置：趣头条趣味 > 奇闻探索 > 谷歌发布寰球模子Genie 2！一键生成3D游戏，东谈主和AI齐能玩

谷歌发布寰球模子Genie 2！一键生成3D游戏，东谈主和AI齐能玩

发布日期：2024-12-08 00:05 点击次数：169

作家 | ZeR0

裁剪 | 漠影

智东西12月5日报谈，AGI竞赛愈演愈烈！就在OpenAI晓谕将于畴昔12天直播新发布和demo前，昨夜，Google DeepMind发布大型基础寰球模子Genie 2，能生成千般可限度手脚、可玩的3D环境，还不错用于磨砺和评估具身agent。

只好给一张教唆图像，Genie 2就能按照你输入的文本教唆，生成对应的交互式造谣寰球。不管是东谈主类已经AI agent，齐不错使用键盘和鼠标来在由AI生成的3D游戏寰球里探索和互动。

Genie 2是一个自转头潜在扩散模子，磨砺于大型视频数据集。过程自动编码器后，视频中的潜在帧被传递到大型Transformer能源学模子。该模子使用与诳言语模子访佛的因果掩码进行磨砺。

在推理时，Genie 2能以自转头形势进行采样，逐帧赢得单个手脚和曩昔的潜在帧。Google DeepMind使用CFG（无分类器领导，classifier-free guidance）来普及手脚可控性。

博客著作放出大宗由未蒸馏的基础模子生成的视频示例，来展示Genie 2在行径限度、生成反设事实、长视界记念、长视频生成、千般环境、3D结构、物体交互、复杂变装动画、NPC、物理、烟雾、光影、快速原型联想方面的后果与上风。蒸馏版块赞助及时交互，但运行时的视觉质地会镌汰些。

输入着实寰球的相片后，它也能很好模拟一些物理章程，比如可模拟风中摇曳的草或河中流动的水。

一、超强空间记念智商，模拟着实寰球环境

此前寰球模子在很猛进程上局限于建模狭隘的鸿沟。Genie 1引入了一种生成千般2D寰球的范例。Genie 2则进一步在通用性上取得发挥，不错生成种类浩荡的丰富3D寰球。

以下是与Genie 2互动的一些示例视频。模子会使用文生图模子Imagen 3生成的单个图像，按照教唆词生成一个可交互的3D寰球。东谈主或agent进行键鼠操作，进入这个新创建的寰球并与之互动。Genie 2不错生成长达1分钟的一致寰球，大多数示例执续10-20秒（本文将部分视频示例转成gif动图并只截取片断，好意思满视频请到原博客著作检察）。

1、智能反映键盘按键操作

Genie 2不错智能地反映键盘上的按键操作，正确地识别并迁移变装。比如下图中的几个示例，模子必须能弄闪现方针按键对应要迁移的是机器东谈主，而不是画面中的树、云等其他物体。