

寻找更聪明的Bot
作者:三联生活周刊( 游戏《虚拟竞技场3》 )
“一个愚蠢的朋友比一个聪明的敌人还要令人挠头”,对于这句谚语,热衷于第一视觉射击游戏(FPS)或即时战略游戏(RTS)的电脑玩家一定感同身受。虽然诸如“虚幻引擎3”已经能使得《战争机械2》轻松地实现每秒钟上亿多边形的即时演算,精确地模拟光影漫射效果,但有些东西仍然亘古未变——就是那些你不得不时常依赖的家伙——无论是在多人对战或者远程网络合作通关中,由人工智能控制的虚拟机器人角色(Bot)常常愚蠢得如同好莱坞恶搞喜剧中的龙套。
虽然最早的AI Bot角色也许是1984年出品的Namco经典街机游戏《小精灵食豆》(Pac Man)中那些四处游弋的幽灵,其粗陋的外观与今日游戏中绘制精美的NPC很难相提并论,但它们的“智商”看起来仍然差别不大,更遑论按照摩尔定律进行飞速进化。很明显,仅依靠游戏画面与分支剧情已经很难使玩家们从中获取足够的乐趣,在2008年10月至2009年10月全球电子娱乐业销售额下滑了19%,只有10.7亿美元的大背景下,全球游戏开发巨头们已经迫不及待地要做点什么来打破瓶颈,重新赢回玩家的芳心了。
2009年11月27日,一场似乎毫不起眼的游戏比赛作为本年度全球计算机科技与人工智能大会的附加活动,在意大利米兰悄然举行。在这场由澳大利亚知名游戏制作室2K悬赏6万美元设立,被誉为“电子娱乐领域的图灵测试”的Bot大奖赛中,其参赛者的终结任务并非是互相PK,直至有人最后胜出,而是展示自己制造的Bot角色能够达到何种“拟人”程度——只要一个游戏制作团队能够创造出一个在经典FPS射击游戏《虚拟竞技场2004》(Unreal Tournament 2004)中,能令80%的评委误以为是玩家操控人物的Bot角色,就能赢得全额奖金。具体规则为,每位评委都在游戏中,以团队对抗模式和两位对手对抗15分钟,然后判定其中哪一个是Bot角色。2009年共有来自日本、美国、英国、巴西的15个游戏程序设计小组参加角逐,虽然人数大大超过2008年,结果却依然令人失望:目标无人达成。2K依旧将一笔1.7万美元的安慰奖,授予了参赛小组中获得票数第一、由澳大利亚国立大学计算机工程系的“大四”学生克里斯·佩林领军的ANU小组。
“曾于2008年参赛的选手迈克尔·斯图尔巴很慷慨地与我分享了他的设计源代码,让我们一开始就跑在了其他参赛者前面。然而充满讽刺意味的是,创造一个在游戏中埋头苦干,射击命中率百分之百,跑位精确,总是能找到对手最佳视野盲点,并及时发现所有补给弹药的角色非常容易——然而这正是竞赛裁判组得以轻松判定其Bot身份的最大破绽,一句话,完美的Bot既要足够聪明,还必须偶尔犯错误。”佩林在接受采访中告诉本刊记者,“《虚拟竞技场2004》的原有内置Bot,最大的问题出在他们的跑位,太精确了,所以我决心做一个看起来类似入门玩家的Bot角色,这是唯一可行的计划。”作为一名狂热的第一视角射击游戏爱好者,佩林已经在《杀出重围》以及《生化悍将》等大作上花费了数千小时,他最终拟定的解决方案是,尽可能地记录一个人类玩家在不同游戏环境下的表现,然后尝试建构一个足够惊喜的数学模型去预测各种游戏场景下人类应当采取的反应。一句话,就是最大限度地用数据积累实现人工智能角色的“模仿学习”能力。
佩林的解决方案虽然“政治正确”,却并不新鲜。实际上,从FPS游戏诞生伊始,游戏开发者就把AI角色的拟人化当做一件相当重要的事情。“玩家越来越期望作为对手的AI,能够在游戏中做出更多套路的策略反应,或者在作为协助自己的NPC时提供更合理的帮助,这是非常合理的。因为现今大多数第一视觉射击游戏的Bot模型来自《雷神之锤Ⅱ》(Quake Ⅱ),从我进入公司开始,迄今为止已经在反复修改的基础上沿用了大概12年。”EPIC游戏工作室的游戏程序师史蒂夫·波杰在接受采访中对本刊记者说。曾设计过《战争机器》、《虚拟竞技场》系列的EPIC,被誉为FPS游戏设计三巨头之首的Epic,迄今为止,仍为许多FPS游戏使用,并奉为经典的Reaper Bot正是波杰本人的得意之作。和佩林的经历相仿,1994年第一视角射击游戏的鼻祖《毁灭战士》(DOOM)让波杰玩得废寝忘食,最终立志献身游戏设计业。
按照波杰的预测,在未来数年中,某个小组设计出一个足以蒙蔽所有评委的Bot角色,最终拿走奖项并不难,因为在封闭的空间,有限的角色和装备,在如此受限的条件下目标最终达成一致相对来说是件轻松的事情。然而,对全球游戏设计者真正构成挑战的,是如何为游戏中的人工智能构筑一个“放之四海而皆准”的数据分析引擎。“让AI Bots角色适应更为复杂的3D空间,并在其中做出复杂运动已经是件了不起的事情,随着游戏时间的推移,让他们的行为实现某种持续进化,是另一个更大的麻烦。一开始,为了维持Bot角色的能力,并保持游戏平衡,我们已经进入了某种模糊的拟人化色彩,我们延迟了它对于目标动作的反应速度,并试图让它像人类一样预测目标的下一步动作。”波杰对我们说,“然而将这些模糊参数量化,将会造成不可抑制的海量运算。另外一个瓶颈就是,它对于游戏升级时新加入元素的学习能力相当缓慢,以《虚拟竞技场2004》为例,较之上一代,Bot角色很难驾驶那些新出现的车辆,飞行区或机械人与玩家协同配合作战,因为这些元素已经很难用简单的二元选择法来判定。”
美国人工智能研究协会从90年代中期开始,也开展过一系列人工智能Bot游戏大赛,遗憾的是,现有的设计框架使得人工智能很难在游戏环境持续变换的情况下仍然保持高水准,即便是《Pac Man》,迄今为止最灵敏的Bot角色所能达到的最高分数仍然只有9万分左右,仅仅是人类玩家历史最高纪录的1/10。
所有这一切努力,其终结目的并非诱使电子游戏上瘾者在电脑屏幕或电视前更卖力地按动手柄或者敲打键盘。作为Bot大奖赛评委之一的得州奥斯汀大学计算机与神经系统科学教授莱斯托·麦库莱就坚持认为,如果能借助游戏设计,使得人工智能Bot的学习能力方面有所突破,那么它最终将促进人工智能在其他领域的应用。在本次全球计算机科技与人工智能大会上,佛罗里达大学电子工程与计算机科学系教授克里斯托弗·莫拉蒂就利用业已开放的《雷神之锤Ⅱ》引擎平台,提出了一个革命性解决方案——“情景学习模块”。促使AI从1秒钟60帧的游戏图像带来的海量讯息中,迅速识别、记录那些真正有意义的行为变化(比如武器的选择),并通过反向传播演算法(BP)归结游戏环境与策略选择之间的因果关系,最终实现Bot经验的积累。在他展示的一场5对5、在Bot角色之间进行的《雷神之锤Ⅱ》比赛录像中,借助情景学习模块构筑的A队以4比0的战绩完胜来自游戏本身的引擎B队。
有了这件利器,许多游戏设计者都不约而同地认为,在未来5年内,所有游戏中的Bot角色的拟人化都会达到令玩家难以分辨的程度。正在埋头制作自己的独立回合制战略游戏《Mayhem Intergalactic》,刚与最大的在线游戏发售平台Steam签订了合同的佩林向本刊记者表示,自己将在2010年Botprize赛事中卷土重来,力争拿到这个奖项。“我并不仅仅是要创造一个在效率上远远凌驾于自己的对手,一枪致命还不够,还需要能够模拟玩家的情绪。它应当能在自己体力下降、弹药不足时选择躲避或逃跑,或者复活以后第一件事情就是朝着上一局里终结自己的家伙冲过去复仇,在屏幕显示‘Game Over’的时候即兴跳一段胜利之舞用以炫耀,等着瞧吧。”■
(感谢BotPrize组委会、史蒂夫·波杰与克里斯·佩林先生提供的资料与大力协助)
(文 / 朱步冲) 人工智能Botbot聪明寻找