《博弈论》里的囚徒困境怎么解决?
当两个参与者Player同时有对对方的最佳反馈时(即达到纳什均衡,也就是同时认罪),就可以得到囚徒困境的最佳结果。
其实两个囚犯如果都否认犯罪,那么便能获得最少的判刑。但是两个囚犯都在关在不同的地方,双方也无法碰面,所以无法确信对方是否会背叛自己。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低,所以二人的理性思考都会得出相同的结论——选择背叛。
因此,这场博弈中只有一种可能能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。
相关如下
囚徒困境经典例子
1950年,由就职于兰德公司的梅里尔·弗勒德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。
若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。