五千年(敝帚自珍)

主题:【原创】纳什均衡即为势--对博弈论的分析 -- baiqi

共:💬43 🌺79
全看分页树展 · 主题 跟帖
家园 重复博弈相比一次博弈产生了质变

其实是我的失误,在混合策略下的均衡点就是一个概率向量(p1,p2,p3,q1,q2,q3),在一般的包剪锤游戏中为(1/3,1/3,1/3,1/3,1/3,1/3).熟人之间产生经常有相同的出拳情况,应该是另有解释。比如说在重复博弈时pi,qi不断的变动,最后产生了p(A出某拳【此拳与B相同】|B出某拳)的概率十分大,在无穷次重复博弈时,概率为100%。这个也可与纳什均衡无矛盾,他们出各拳的概率为1/3,但是出相同的拳的概率为1.但是这个具体是怎么来的,真应了你说的那句,要考虑“玩家在尚未到达均衡之际(其实大部分时间都是off equilibrium的)是如何对别人的策略做出反应的”。如果你有什么见解,请不吝赐教。

另外一个,不光是你这儿提到的,混合策略模型中重复博弈不能趋于绝对理性人一次博弈得到的结果;其实重复博弈相比一次博弈产生了质变,普遍会得到不同的结果。

例如囚徒困境,如果是重复博弈的话,那么囚徒会认识到合作的可能性,并试探之。如果某个囚徒采取一报还一报的策略(1.第一次是合作2.以后每一次视对方上一次是合作还是背叛来作出决择:对方上一次与我合作[即两人都不招供]我这回就合作,上一回背叛我,那么我这回也要背叛)那么如果有n个囚徒两两重复博弈,这一策略却是得分最高的。

所以重复博弈、多人博弈都带来了游戏的质变。

你给出的链接我看了,你要阐述的主旨大体明白,但图例还有不懂的地方,尤其是一些字母的含义。另外有个想法,不妨这样思考:重复博弈会带来质变,如果在重复博弈下考察趋进这个问题,事实上整个游戏都变了,不如换成绝对理性人一次博弈,根据你给出的bad rps game的规则,看看会得到什么结果。按照纳什的博弈论,有个均衡解。也就是有个均衡概率向量。而如果变成重复博弈,每个理性人在第一次就产生了均衡解,往后会如何发展呢?重复博弈到底有什么本质的不同?这真是个很大的问题啊。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河