如何用Python写一个贪吃蛇AI
2016-11-18
首先,让我们罗列一些问题: (像头脑风暴那样,想到什么就写下来即可)
蛇和食物间有路径直接就去吃,不可取。那该怎么办?
如果蛇去吃食物后,布局是安全的,是否就直接去吃?(这样最优吗?)
怎样定义布局是否安全?
蛇和食物之间如果没有路径,怎么办?
最短路径是否最优?(这个明显不是了)
那么,如果布局安全的情况下,最短路径是否最优?
除了最短路径,我们还可以怎么走?S形?最长?
怎么应对蛇身越来越长这个问题?
食物是随机出现的,有没可能出现无解的布局?
暴力法(brute force)能否得到最优序列?(让贪吃蛇尽可能地多吃食物)
只要去想,问题还挺多的。这时让我们以面向过程的思想,带着上面的问题,
把思路理一理。一开始,蛇很短(初始化长度为1),它看到了一个食物, 使用 BFS 得到矩形中每个位置到达食物的最短路径长度。在没有蛇身阻挡下,
就是曼哈顿距离。然后,我要先判断一下,贪吃蛇这一去是否安全。 所以我需要一条虚拟的蛇,它每次负责去探路。如果安全,才让真正的蛇去跑。
当然,虚拟的蛇是不会绘制出来的,它只负责模拟探路。那么, 怎么定义一个布局是安全的呢? 如果你把文章开头那张动态图片中蛇的销魂走位好好的看一下,
会发现即使到最后蛇身已经很长了,它仍然没事一般地走出了一条路。而且, 是跟着蛇尾走的!嗯,这个其实不难解释,蛇在运动的过程中,消耗蛇身,
蛇尾后面总是不断地出现新的空间。蛇短的时候还无所谓,当蛇一长, 就会发现,要想活下来,基本就只能追着蛇尾跑了。在追着蛇尾跑的过程中,
再去考虑能否安全地吃到食物。(下图是某次 BFS 后,得到的一个布局, 0 代表食物,数字代表该位置到达食物的距离,+号代表蛇头,*号代表蛇身,
-号代表蛇尾,#号代表空格,外面的一圈#号代表围墙)
# # # # # # #
# 0 1 2 3 4 #
# 1 2 3 # 5 #
# 2 3 4 - 6 #
# 3 + * * 7 #
# 4 5 6 7 8 #
# # # # # # #
经过上面的分析,我们可以将布局是否安全定义为蛇是否可以跟着蛇尾运动, 也就是蛇吃完食物后,蛇头和蛇尾间是否存在路径,如果存在,我就认为是安全的。
OK,继续。真蛇派出虚拟蛇去探路后,发现吃完食物后的布局是安全的。那么,
真蛇就直奔食物了。等等,这样的策略好吗?未必。因为蛇每运动一步, 布局就变化一次。布局一变就意味着可能存在更优解。比如因为蛇尾的消耗,
原本需要绕路才能吃到的食物,突然就出现在蛇眼前了。所以,真蛇走一步后, 更好的做法是,重新做 BFS。然后和上面一样进行安全判断,然后再走。
接下来我们来考虑一下,如果蛇和食物之间不存在路径怎么办? 上文其实已经提到了做法了,跟着蛇尾走。只要蛇和食物间不存在路径, 蛇就一直跟着蛇尾走。同样的,由于每走一步布局就会改变, 所以每走一步就重新做 BFS 得到最新布局。
好了,问题又来了。如果蛇和食物间不存在路径且蛇和蛇尾间也不存在路径,
怎么办?这个我是没办法了,选一步可行的路径来走就是了。还是一个道理, 每次只走一步,更新布局,然后再判断蛇和食物间是否有安全路径;
没有的话,蛇头和蛇尾间是否存在路径;还没有,再挑一步可行的来走。
上面列的好几个问题里都涉及到蛇的行走策略,一般而言, 我们会让蛇每次都走最短路径。这是针对蛇去吃食物的时候,
可是蛇在追自己的尾巴的时候就不能这么考虑了。我们希望的是蛇头在追蛇尾的过程中,
尽可能地慢。这样蛇头和蛇尾间才能腾出更多的空间,空间多才有得发展。 所以蛇的行走策略主要分为两种:
1. 目标是食物时,走最短路径
2. 目标是蛇尾时,走最长路径
那第三种情况呢?与食物和蛇尾都没路径存在的情况下, 这个时候本来就只是挑一步可行的步子来走,最短最长关系都不大了。
至于人为地让蛇走S形,我觉得这不是什么好策略,最初版本中已经分析过它的问题了。 (当然,除非你想使用最最无懈可击的那个版本,就是完全不管食物,
让蛇一直走S,然后在墙边留下一条过道即可。这样一来, 蛇总是可以完美地把所有食物吃完,然后占满整个空间,可是就很 boring 了。
没有任何的意思)
上面还提到一个问题:因为食物是随机出现的,有没可能出现无解的局面? 答案是:有。我运行了程序,然后把每一次布局都输出到 log,发现会有这样的情况:
# # # # # # #
# * * * * * #
# * * - 0 * #
# * * # + * #
# * * * * * #
# * * * * * #
# # # # # # #
其中,+号是蛇头,-号是蛇尾,*号是蛇身,0 是食物,#号代表空格,外面一圈# 号代表墙。这个布局上,食物已经在蛇头面前了,可是它能吃吗?不能! 因为它吃完食物后,长度加1,蛇头就会把 0 的位置填上,布局就变成:
# # # # # # #
# * * * * * #
# * * - + * #
# * * # * * #
# * * * * * #
# * * * * * #
# # # # # # #
此时,由于蛇的长度加1,蛇尾没有动,而蛇头被自己围着,挂掉了。可是, 我们却还有一个空白的格子#没有填充。按照我们之前教给蛇的策略,
面对这种情况,蛇头就只会一直追着蛇尾跑,每当它和食物有路径时, 它让虚拟的蛇跑一遍发现,得到的新布局是不安全的,所以不会去吃食物,
而是选择继续追着蛇尾跑。然后它就这样一直跑,一直跑。死循环, 直到你按 ESC 键为止。
由于食物是随机出现的,所以有可能出现上面这种无解的布局。当然了, 你也可以得到完满的结局,贪吃蛇把整个矩形都填充满。
上面的最后一个问题,暴力法是否能得到最优序列。从上面的分析看来, 可以得到,但不能保证一定得到。
最后,看看高瞻远瞩的蛇是怎么跑的吧: