囚徒困境
1个回答
展开全部
囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判十年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。
还看过一个关于类似的故事,觉得比这个好些,大概是讲如果两个人互相选择对方有利的就可以得到4个3分,两个人都可以成功。不过记不太清了。
看过一些经济学或者博弈论的人都知道这个抽象出来典型故事。这是一个关于选择和结果的判断过程。这个故事的重点在于囚徒本人理性上不可能选择最优的结果。与此相关还有一些心理学习的总结。实际上最终问的是是否将利人作为自己的选择。也可以是在问仁与善到底从何来来。其实我很不喜欢用这个故事做隐喻,警察,囚徒的身份在心中有很多先验性的判定。
实际上这个问题还可以在物理学上的宏观和微观层面上得到解释。也可以在说明一个问题,一个文化的其终极意义。得到理论上的最优结果,并建立起群体为之付出的理念。所以这里说的也并不是某一次选择,而是很多次的选择。
现在运用计算机程序已基本上模拟出下面这个结果。
两次竞赛中获胜的策略——平均得分最高——都是所提交的策略中最简单的策略:针锋相对(TIT FOR TAT)。这个策略是数学家拉普波特(Anatol Rapoport)提交的,第一个回合合作,然后在后面的回合中采取对手在前一回合中所使用的策略。也就是说针锋相对策略愿意合作,并且对愿意合作的对手以礼相待。但如果对方背叛,针锋相对策略就会回之以背叛,直到对手又开始合作为止。
让人吃惊的是,这样简单的策略竟然打败了其他所有策略,尤其是第2次竞赛时参赛者已经知道了针锋相对策略,可以有针对性地与它对抗。然而,在参赛的几十位专家中,没有人能设计出更好的策略。
采取“友善、报复、宽恕、明确”的原则,正是阿克塞尔罗德在重复囚徒困境中指出的成功所需的条件。
上面囚徒困境来自百度百科,计算机实验摘自《复杂》。
计算机的模拟将远远大于生命的长度。可是个体的人还是得面对一次又一次单个的选择。总有那么一些人,傻傻的选择了美好。再回头看看那些令人感动的就是这些傻傻的美好。
还看过一个关于类似的故事,觉得比这个好些,大概是讲如果两个人互相选择对方有利的就可以得到4个3分,两个人都可以成功。不过记不太清了。
看过一些经济学或者博弈论的人都知道这个抽象出来典型故事。这是一个关于选择和结果的判断过程。这个故事的重点在于囚徒本人理性上不可能选择最优的结果。与此相关还有一些心理学习的总结。实际上最终问的是是否将利人作为自己的选择。也可以是在问仁与善到底从何来来。其实我很不喜欢用这个故事做隐喻,警察,囚徒的身份在心中有很多先验性的判定。
实际上这个问题还可以在物理学上的宏观和微观层面上得到解释。也可以在说明一个问题,一个文化的其终极意义。得到理论上的最优结果,并建立起群体为之付出的理念。所以这里说的也并不是某一次选择,而是很多次的选择。
现在运用计算机程序已基本上模拟出下面这个结果。
两次竞赛中获胜的策略——平均得分最高——都是所提交的策略中最简单的策略:针锋相对(TIT FOR TAT)。这个策略是数学家拉普波特(Anatol Rapoport)提交的,第一个回合合作,然后在后面的回合中采取对手在前一回合中所使用的策略。也就是说针锋相对策略愿意合作,并且对愿意合作的对手以礼相待。但如果对方背叛,针锋相对策略就会回之以背叛,直到对手又开始合作为止。
让人吃惊的是,这样简单的策略竟然打败了其他所有策略,尤其是第2次竞赛时参赛者已经知道了针锋相对策略,可以有针对性地与它对抗。然而,在参赛的几十位专家中,没有人能设计出更好的策略。
采取“友善、报复、宽恕、明确”的原则,正是阿克塞尔罗德在重复囚徒困境中指出的成功所需的条件。
上面囚徒困境来自百度百科,计算机实验摘自《复杂》。
计算机的模拟将远远大于生命的长度。可是个体的人还是得面对一次又一次单个的选择。总有那么一些人,傻傻的选择了美好。再回头看看那些令人感动的就是这些傻傻的美好。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询