

在训练AI系统时,游戏是现实世界任务的良好代理。斯坦福大学(Stanford University)计算机科学副教授迈克尔·伯恩斯坦(Michael Bernstein)说:“原则上,一个一般的游戏代理可以比任何一个单一环境中的东西学到更多关于如何驾驭我们的世界的知识。”伯恩斯坦并未参与这项研究。
谷歌DeepMind的研究工程师蒂姆?哈雷(Tim Harley)是开发该智能体的团队成员之一,他说:“可以想象,有一天,我们可以让像SIMA这样的智能体与你和你的朋友一起玩游戏,而不是与你对抗的超人智能体。”
谷歌DeepMind的研究工程师弗雷德里克·贝塞(Frederic Besse)说,该团队在大量人类玩电子游戏的例子上训练了SIMA,包括个人和合作,以及键盘和鼠标输入,并对玩家在游戏中的行为进行注释。
然后,他们使用一种称为模仿学习的人工智能技术来教代理像人类一样玩游戏。SIMA可以遵循600个基本指令,比如“左转”、“爬梯子”和“打开地图”,每一个指令都可以在不到10秒的时间内完成。
该团队发现,在许多游戏中训练的SIMA代理比只学习如何玩一种游戏的代理要好。Besse表示,这是因为它能够利用游戏之间共享的概念来学习更好的技能,并更好地执行指令。
他说:“这又是一个非常令人兴奋的关键特性,因为我们有了一个可以玩以前从未见过的游戏的代理。”
伦敦玛丽女王大学(Queen Mary University of London)人工智能讲师保罗·劳伯(Paulo Rauber)表示,看到游戏之间的这种知识转移是人工智能研究的一个重要里程碑。
Rauber说,在人类提供的例子的基础上学习执行指令的基本思想可能会在未来导致更强大的系统,特别是在更大的数据集上。他说,SIMA相对有限的数据集阻碍了它的表现。