多次的囚徒困境有没有纳什均衡?为什么说混合策略一定存在纳什均衡 250
为什么囚徒困境从尾部开始考虑就会得出从一开始就不应该合作的结论,而根据统计来说最佳策略是以眼还眼,以牙还牙的策略?多次囚徒困境与混合策略有什么区别?回答满意的可以继续加悬...
为什么囚徒困境从尾部开始考虑就会得出从一开始就不应该合作的结论,而根据统计来说最佳策略是 以眼还眼,以牙还牙 的策略?多次囚徒困境与混合策略有什么区别?
回答满意的可以继续加悬赏 展开
回答满意的可以继续加悬赏 展开
1个回答
2016-08-31
展开全部
你这条提问包含5问。其中有的提问大前提就不对。
多次的囚徒困境,和单次发生的囚徒困境,结果是不会一样。
多次的囚徒困境,存在纳什均衡。
纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略(pure strategy)。如果在每个给定信息下只以某种概率选择不同策略,称为混合策略(mixed strategy)。
在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去"惩罚"另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
多次的囚徒困境,和单次发生的囚徒困境,结果是不会一样。
多次的囚徒困境,存在纳什均衡。
纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略(pure strategy)。如果在每个给定信息下只以某种概率选择不同策略,称为混合策略(mixed strategy)。
在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去"惩罚"另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
追问
如果是多次但是有限的囚徒困境问题的话,如果从最后一次开始考虑, 那么因为后面没有更多的博弈了,那么就不会有惩罚的反馈, 因此最后一次就会和单次的结果相同--不合作.然后再考虑倒数第二次博弈, 因为倒数第一次是确定不合作的结果,那么就相当于倒数第二次也不会有惩罚的反馈,因为无论如何都不能改变最后一次的结果的.那么倒数第二次也就会不合作. 然后考虑倒数第三...类推得出最开始就不应该合作的结果.
来自:求助得到的回答
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询