摘要:把世界装进一台机器。,从 SimCity 到 Genie 3 :三十年来,我们一直在教机器”想象”世界, simcity.cn

⚠️ 未经作者授权 禁止转载
引言
“SimCity 在电脑里运行的那个模型其实很浅。真正重要的产品,是玩家脑海中构建起来的那个更深层的心智模型 — 对 诚恳 全球、对复杂动态 体系的直觉 领会。”
这段话来自 Don Hopkins —— 他曾负责将 SimCity 移植到 Unix 平台并重写了其用户界面,是离这款游戏源代码最近的人 其中一个。他在回忆与 Will Wright 共事的经历时写下了这句话。 几十年后,Chaim Gingold 在他的著作《Building SimCity: How to Put the World in a Machine ’里面 体系性地展开了同一个论断:SimCity 的本质不是一款城市经营游戏,而是人类第一次认真尝试用计算机构建一个”可操作的 全球缩影”。
这本书表面上在讲一款 1989 年发行的游戏的开发史,但实质上探讨的 一个远比游戏本身更大的 难题:人类 怎样通过计算机来 领会和重构复杂 全球?这个 难题在 2026 年的今天,突然变得比以往任 什么时候候候都更紧迫。一座 16×16 像素网格上的城市
让我们先回到 1989 年。 你坐在一台 Macintosh 前,面前是一片空白的绿色网格。你在网格上放下一座发电站,拉出一条输电线,划定一片住宅区。 接着你按下”开始”。 起初 何都没发生。但几秒钟后,第一栋小房子出现了。 接着是第二栋。居民搬进来了,他们需要 职业,于是你在旁边划出商业区。车流开始在你建好的道路上移动。税收涨了。你有钱建学校了。人口突破一万。城市开始有了自己的节奏。 但 接着 难题来了 —— 交通堵塞。远处有一块地皮犯罪率飙升。一场意外的火灾烧掉了半个街区。你忙不迭地调整预算、修路、建警察局,但城市的衰退似乎有了自己的惯性,不那么容易被你的操作扭转。 你第一次 觉悟到:你并没有在”控制”这座城市,你只是在跟它对话。
这正是 Will Wright 想要制造的体验。在 Wright 看来,游戏是帮助 大众建立”心智模型”(mental models)的方式 — 让人 领会 全球上某些部分是 怎样运作的 。SimCity 的目标不是精确模拟一座城市 —— Wright 自己就说过,“SimCity 并不匹配现实。 诚恳的市政管理对他来说不 一个游戏” ,他在精确性和趣味性之间始终选择后者。但这恰恰是天才之处:通过一个精心简化的模型,他让数百万人第一次对”复杂 体系”建立了直觉 —— 何是正反馈循环、 何是涌现行为、 何故一个看似微小的决策会在十年后引发连锁反应。Wright 从不认为 SimCity 是一款”游戏”,他始终称它为“软件玩具”(Software Toy)。这个定义至关重要 —— 玩具没有预设的胜负条件,它邀请你探索,而不是要求你征服。每次启动 SimCity,最有趣的 事务是你必须自己决定目标:是建造最大的城市,还是最 高兴的居民,还是最多的公园? 这种开放性让它比任何传统游戏都有更大的”可玩空间”。Gingold 在书中把 SimCity 放进了一个更宏大的 想法谱系里。Wright 从 体系动力学和元胞自动机这两个传统中汲取灵感 —— 这是两种截然不同的观察、 思索和用计算机表达 全球的方式 。
体系动力学是自上而下的:你定义存量、流量和反馈回路,描绘宏观 动向;而元胞自动机是自下而上的 —— 你定义个体的简单 制度, 接着看复杂行为从碰撞中涌现出来。SimCity 的天才在于,他把这两股力量焊接在了同一块电路板上。那块 16×16 像素的网格,就是人类第一次用消费级计算机装下了一个”活的 全球”。三十七年后,同一个 难题
现在,请你做一个 想法实验: 把“一台 1989 年的 Macintosh”替换成“一个 2026 年的浏览器窗口”。你在对话框里输入一段话:“一座被暴雨笼罩的赛博朋克城市,霓虹灯在积水的街道上倒映,远处有一座巨型全息广告牌。” 你按下回车。几秒钟后,一个完整的 3D 场景在你面前生成了。你用键盘控制一个角色走进这座城市。雨滴落在地上溅起水花。路过一辆飞行汽车时,它的引擎声从左耳滑向右耳。你走进一条小巷,AI 实时生成了你之前从未见过的街景 —— 一家拉面店、一个自动贩卖机、一扇半开的铁门。这不是某款 3A 游戏的预告片,这是 Google DeepMind 的 Project Genie 在 2026 年 1 月向用户开放的功能。这个实验性原型让用户用文本和图片构建环境, 接着实时在其中导航。与静态 3D 快照不同,Genie 3 在你移动和交互的同时实时生成前方的路径 。
几乎与此同时,Microsoft Research 发布了 Muse —— 首个” 全球与人类行为模型”(WHAM),使用超过 10 亿帧图像和控制器动作训练而成 ,它能生成可玩的游戏片段,甚至可能被用来复活已经无法运行的经典游戏。以色列初创公司 Decart 的 Oasis 用一个 Transformer 模型实时生成了类似 Minecraft 的开放 全球。而 AI 先驱李飞飞创办的 World Labs 则推出了 Marble — 这是第一个能生成持久化、可下载的 3D 环境的 全球模型,用户可以在其中编辑、扩展、导出标准 3D 格式,直接接入游戏或影视制作流程。
这些项目来自不同的公司,使用不同的技术路线,瞄准不同的应用场景。但如果你后退一步看,它们在做的 事务本质上与 Will Wright 在 1989 年做的 事务完全一样:把 全球装进一台机器。差别只在于,Wright 需要逐行编写每一条模拟 制度;而今天的 AI 从海量视频中”看”过了无数个 全球之后,学会了自己想象新的 全球。 这个差别看似只是效率的提升,但它可能代表了游戏开发 —— 乃至整个数字 全球构建的一次范式跃迁。 接下来,我想从《Building SimCity》这本书出发,顺着” 怎样把 全球装进机器”这条线索,梳理从 SimCity 到 AI 全球模型的三十年脉络,看看我们走了多远,以及还有多远要走。