VOL. 01·ISSUE 02
AI Gaming Weekly.
2026 · MAY · 21
An editorial weekly on AI × Games · 本期覆盖 2026.05.14 – 05.20 · Edited by 常言道
This Week's Picks

本周 三大 AI 突破
正在改写游戏的底层

Odyssey 让四个人钻进同一个 AI 幻觉世界里联机打《黄金眼》 · 谷歌 I/O 把 Gemini 捏成一个"任意输入 → 任意输出"的全家桶 · 微软与腾讯把图生 3D 推到"一张图、几秒钟、直接进引擎"

A
Agora-1 · Multi-Agent World Model
5/18 研究预览
01 World Models · AI Native

Odyssey Agora-1

过去一年的世界模型(Genie 3 / Multiverse / Solaris)几乎都是单人、各玩各的。Agora-1 第一次做出 "多人同处一个由模型实时生成的世界":没有游戏引擎、没有代码、没有预制贴图,一张神经网络逐帧"幻觉"出可玩世界,4 名玩家或 AI 各自独立视角实时渲染、却共享同一份世界状态。Odyssey 用 N64 经典《黄金眼 007》当试验场,CEO Oliver Cameron 于 5/18 放出可玩研究预览。架构上把"模拟"与"渲染"拆成两个模型——一个状态模型学游戏动态与状态转移,一个 DiT 渲染模型为每名玩家生成一致画面;同周还放出实时多模态世界模型 Starchild-1(音视频自回归同步、24fps)。世界模型由此从"生成一段视频"跨到"一个能联机、有一致状态的可玩世界",多人能力抢在李飞飞 World Labs 前面落地。

KEYWORDS 多智能体 · 4 人联机 · 无引擎无代码 · 状态/渲染双模型 · 抢先 World Labs

读 Odyssey 官方发布
G
Gemini Omni · 3.5 Flash · Genie 3
5/19 I/O 2026
02 AI 大模型 · Google I/O

Gemini 全家桶

谷歌 I/O 2026 一口气把 Gemini 重做成 "任意输入 → 任意输出" 的全家桶,三条线同时推进。① Gemini Omni:单一模型统一文 / 图 / 音 / 视频的生成与编辑(非多模型拼接),首发 Omni Flash,当日上 Gemini App、YouTube Shorts 与 Flow,全部输出带 SynthID 水印可溯源。② Gemini 3.5 Flash:定位 agentic coding,官方称输出速度是同类前沿模型 4 倍、关键 benchmark 反超自家 3.1 Pro,配 agent-first 的 Antigravity 2.0 IDE。③ Project Genie(世界模型)接入 Street View,真实街道变成可交互、可漫游、可改天气光照的 3D 环境,面向机器人仿真、游戏与虚拟旅行。对游戏行业,这是底座一次把"多模态生成 + 编程 Agent + 世界模型"三线同时往前顶。

KEYWORDS Gemini Omni · 3.5 Flash · Antigravity 2.0 · Genie 街景 · SynthID 水印

读 Google I/O 2026 汇总
3D
Image → 3D · Seconds
5/19 开源
03 AI 辅助制作 · Image-to-3D

图生 3D 进入秒级时代

游戏美术管线这周被狠狠推了一把。微软研究院开源 TRELLIS.2-4B(40 亿参数,O-Voxel 架构 + Flow-Matching Transformer,MIT 协议):单张图几秒生成带 PBR 材质的 3D 资产,分辨率到 1536³,能处理开放面 / 非流形 / 封闭内腔等传统方法搞不定的拓扑,导出 GLB / OBJ / PLY 直接进 UE / Unity,权重已上 HuggingFace。腾讯 ARC 的 Pixal3D(基于 Trellis.2 升级、SIGGRAPH 2026 接收)主打"接近重建级"几何精度,放出推理代码 + 在线 demo。两者都是开源 + 免费 demo,直接对标商业付费的 Meshy / Tripo。意义很直接:从概念图到可用 3D 资产的成本,从"数小时手工建模"压到"几秒一次推理"。

KEYWORDS 微软开源 · MIT 协议 · PBR 1536³ · 腾讯 Pixal3D · 对标 Meshy/Tripo

看 TRELLIS.2 开源仓库
More This Week

本周速读

3 条值得一看
Dev Agents · 开发 Agent
编程 Agent 一周三连
一周之内三家把"写代码"交给 Agent:马斯克 xAI 推出 GrokBuild 编程 Agent;OpenAI Codex 手机版上线、随时随地起任务;阿里云 Qoder 1.0 升级为自主 Agent 开发工作空间。叠加谷歌 Antigravity 2.0,IDE 正快速变成"人给目标、Agent 写实现"。
AI Drama · AI 短剧
AI 短剧开始工业化
内容侧两条线落地:Topview 推出 AI 原生短剧制作平台 Drama Studio,把分镜到成片做成流水线;Shortical 上线首部 AI 微剧 《命运之缚》,AI 角色还在社交平台"过自己的生活"。AI 泛娱乐正从单条 demo 走向可批量产出的内容工厂。
NPC Voice · 语音链路
Inworld 补齐 NPC 语音管线
专做游戏 AI 的 Inworld 一周连发两件:Realtime Router 实时路由(按场景动态切模型,压延迟与成本)+ STT API(语音转写同时返回完整"语音画像")。给 AI NPC 的"听—想—说"实时链路补上关键一环。