五千年(敝帚自珍)

主题:【原创】日志随笔短平快-by 老马丁 -- 老马丁

共:💬988 🌺3533 🌵17
分页树展主题 · 全看首页 上页
/ 66
下页 末页
          • 家园 重复囚徒困境和囚徒困境还是不一样的吧

            正如你所说的,囚徒困境只是两个人博弈;重复囚徒困境是多人博弈。我所指的重复囚徒困境好像就是演化博弈论的范围内的呀。

            这里还是把原文链接和文摘都放这里吧:

            美国密西根大学一位叫做罗伯特·爱克斯罗德的人是一个政治科学家,他组织了一场计算机竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。关键问题在于,他们不只玩一遍这个游戏,而是一遍一遍地玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”。

                “重复的囚徒困境”更逼真地反映了具有经常而长期性的人际关系。而且,这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次,则双方就建立了各自的历史档案,用以记录与对手的交往情况。同时,它们各自也通过多次的交手树立了或好或差的声誉。虽然如此,对方的程序下一步将会如何举动却仍然极难确定。实际上,这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何种举动都采取合作的态度吗?或者,它能总是采取背叛行动吗?它是否应该对对手的举动回之以更为复杂的举措?如果是,那会是怎么样的举措呢?

            1. "Effective Choice in the Prisoner's Dilemma", Robert Axelrod, The Journal of Conflict Resolution, Vol. 24, No.1 (Mar., 1980), 3-25.

            2. "More Effective Choice in the Prisoner's Dilemma", Robert Axelrod, The Journal of Conflict Resolution, Vol. 24, No. 3(Sep., 1980), 279-403.

            • 家园 “重复”和“多人”不一样

              可能是定义的问题,“重复”(repeated game)强调的同一个游戏反复玩,而玩家的角色一般是不变的,就看如果他要全盘考虑将来会不会改变玩家的决策。

              而“多人”突出的差别是玩家人数不是一个两个,经常是一大堆。当然多人游戏也可以重复,就是熟人反复碰到。其实axelrod的设置是多人且重复,因为人多而且有熟人。

              就像你的引文,比如他如果他很在意将来的回报,他会更愿意“积攒人品”。前提是,“人品”这个信息是大家都能看到的公开的,不然没用。可是谁上街挂一个“人品指数”的牌子啊,即使要挂,人人都写“我是大好人”。另一方面,ebay的好评数因为比较可信,也就更值钱,比起淘宝来讲奥。所以我一直觉得淘宝网的”基础建设“没做好,就是市场环境比较恶劣,所以丢失了很大一块可以创造的价值,那就是信息披露。说远了。

              • 家园 好像是翻译的问题吧

                我的原文中提到的是“iterated prisoner's dilemma”,这里的“iterated”,翻译成“重复”,但是其中也有“多人重复”的意思,我引的那篇文摘里面写得也不是很清楚,Robert Axelrod的原文(呵呵,也是老马丁文章里面的进化合作博弈论的开山鼻祖)里面所采取的方法就是巡回赛:每个人都和所有的其他的选手交手N次,这也就是我说的“重复”的意思了。

                嗯,这样看来我开始说的好像还是对的,老马丁原文引用的wiki条目也说道了这个Iterated Prisoner's Dilema,也提到了Axelrod的那个巡回赛方式。

      • 家园 2004年听过浙大汪丁丁、叶航、罗卫东的一个讲座

        他们似乎也有类似的观点,即感恩是有遗传学解释的。

        他们一直在尝试利用跨学科的视角研究经济现象,所以在实验经济学、人类学、演化心理学、哲学、社会学、生物学、认知科学、脑科学等方面的知识上都有所借鉴。

      • 家园 最新研究给老马丁的观点做个见证

        MIT科学家应用博弈论解释进化论难题外链出处

        研究实际发现,分泌转化酶的酵母对于它们制造的单糖拥有大约1%的优先使用权。这一获益超过了帮助别人所需的代价,使得它们能够成功地与欺诈者进行竞争。

        此外,不论开始的酵母种群数量是多少,最后都会达到一种平衡状态,合作者和欺诈者同时存在。

      • 家园 um, 是这个理儿。
      • 家园 我想起一句老话

        人不犯我,我不犯人,人若犯我,我必犯人。

      • 家园 感恩报恩,送花献宝

        谢谢:作者意外获得【通宝】一枚

        鲜花已经成功送出。

        此次送花为【有效送花赞扬,涨乐善、声望】

      • 家园 让我想起了囚犯的那个故事

        让我想起了囚犯的那个故事

        这个是经济学中的垄断竞争的例子。

        警察抓到2个犯罪嫌疑人,2个人都是单独审讯,不能串供。

        如果一个人揭发对方,一个保持沉默,那么揭发的人无罪释放,保持沉默的人判20年。

        如果2个人都保持沉默,那么无法定罪,2个人都判2年。

        如果2个人都揭发对方,那么就会都判8年。

        问如果你是犯罪嫌疑人,你采用什么策略?

        如果监狱里所有的囚犯任意两人配对,做这种揭发还是沉默的游戏,配对完全随机,实验次数很多,接近无限(同样两个人可能碰见无限次),问采用什么策略才能保持所被判年数相加最小?

        这个我觉得跟马丁兄的例子很像,都是采用follow the last choice.就是根据对方上次对你使用的手段,在下次采用同样的手段。如果对方对你好,下次你就奖励他,保持沉默;如果上次对你坏,下次你就要惩罚他,就是以牙还牙。这样对方在几次过后就学乖了。

      • 家园 社会生物学有这方面的研究

        演化博弈论吧

        看帖不认真,没看见老马丁开头就提到进化合作博弈论了。

      • 家园 好象有新的结果

        看到你的文章想起前几年听人提过,最好的策略是以牙还牙,但有可能原谅对方。我搜索了一下:

        A slightly better strategy - because it avoids the possibility of getting trapped into long cycles of retaliation - is "Tit for Tat with forgiveness". This is Tit for Tat with a small randomised possibility of forgiving a defaulter by cooperating anyway. Forgiveness is particularly helpful if you introduce the possibility of misinformation into the game - that is, if moves are sometimes randomly misreported.
        外链出处

        但文章作者表示更重要的是竞争的环境,其他竞争者的策略。

        如果这是正确的话,那后天的可能性更大。

        • 家园 老兄是研究sociology吧

          我对这个一直感兴趣。哪天请教一下

          • 家园 贡献文献

            哈佛成立了一个专门的Program for Evolutionary Dynamics 外链出处,有关于社会学的进化,也有生物医学方面,上面那个链接是专门研讨博弈论的。值得注意的作者有Martin Nowak, Yoh Iwasa。

            接下来我就直接把自己的一些reference贴上来,大家分享讨论。

            Yoh Iwasa. The leading eight: Social norms that can maintain cooperation by indirect reciprocity. Journal of Theoretical Biology 239 (2006) 435–444

            Altruists, Egoists, and Hooligans in a Local Interaction Model

            Ilan Eshel, Larry Samuelson, Avner Shaked. The American Economic Review, Vol. 88, No. 1 (Mar., 1998), pp. 157-179

            Evolution of cooperation without reciprocity. Rick L Riolo, Michael D Cohen, Robert Axelrod. Nature, Vol. 414, No. 6862. (22 November 2001), pp. 441-443.

            Multi-level evolution in population games. J Canals, F Vega-Redondo. International Journal of Game Theory, 1998

分页树展主题 · 全看首页 上页
/ 66
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河