五千年(敝帚自珍)

主题:【原创】投资中的几何均值最大化原则 -- beiba

共:💬10 🌺105
分页树展主题 · 全看首页 上页
/ 1
下页 末页
  • 家园 【原创】投资中的几何均值最大化原则

    投资的最重要的原则之一(个人认为是应该去掉“之一”)是资产配置。所谓资产配置,用炒股票来打比方,当选好几只股票后,资金用什么样的比例分配到这些股票上。如果你和我一样对于巴菲特、彼得林奇、杰西利弗莫尔和约翰梅利韦瑟等著名的投资、投机家有过研究,大概得出的结论也差不多。巴菲特致股东的年报里多次低调的强调资产配置的重要性。而杰西利弗莫尔虽然是天才炒家,但是一辈子也没学会资产配置,最后穷困潦倒而死。

    关于资产配置,其实原则只有一个,几何均值最大化。查理芒格推荐书目里的《财富公式》对此略有提及。事实上国内外也早有人对此有过深入的研究。本文避免使用学术性的“对数投资理论”,”信息熵投资理论”等名词,而是对背后的根本原则进行浅白的描述。

    先从一个电视游戏节目Deal / No deal谈起。游戏里一共有26个箱子,里面分别有100万美元,75万, 50万, 40万, 30万, 20万,10万,7万5,5万,2万5,1万,5千,1千… 最小的是1块。 选手选定一个。 然后一个个打开剩下的箱子,打开一个之后该箱子的金额就被淘汰出局。 Banker根据剩下的金额开价买你的箱子, 看你卖还是不卖, Deal or No Deal。往往最刺激的是在最后,除掉最初选中的箱子,还剩一个箱子的时候,两个箱子里金额一大一小,最极端的是100万和1块。问题来了,选手应该接受的出价是多少?简单的想法是,直接算术平均值,50万,低于50万就坚持赌运气,50万就接受。但是事实上,banker从来没有开到过这么高的价钱,而选手们几乎在三四十万就都缴械投降。

    而这个问题的答案,就是用几何均值去寻找。如果选手是个穷光蛋,那么1和100万的几何均值是1000块。出价到1000块就接受走人。如果选手身家有10万,那么10万零1块和100万零1块的几何均值是316230,那么出价到21万多就应该接受了。如果是身家100万的中产,100万和200万的几何均值是141万,出到41万就接受。

    一个有趣的关于deal / no deal的现象,就是黑人选手普遍拿得低,而白人选手普遍拿得高。用几何均值原则去理解就是白人的身家较高,而非某些人所谓的智商之间有差异,这也符合现实。事实上,几何均值最大化原则,其实就是熵极值原则(笔者上一篇文章有过阐述),不仅仅是投资的重要原则,也是进化的根本规律。篇幅有限,这里就不展开了。

    再来看看投资一个股票(或者项目)时,如何运用几何均值最大化原则。如果该股票有70%的几率赚钱,而30%的几率赔钱,赚钱时能赚1倍,赔钱时赔光。那么,假设投资到项目的资金比例为x,那么(1+x)^0.7*(1-x)^0.3就是几何均值。用数学方法求极值也好,excel规划求解也好,可以得到结果是x=40%时几何均值最大。即40%的资金投入到该项目中。

    事实上,有更简单的凯利公式,能直接算出结果是40%。凯利公式是几何均值最大化原则的一个简化形式。

    当有两个或以上的股票(投资标的)时,凯利公式就无能为力了,但是几何均值最大原则仍然可用。假设有两只股票A和B,赚钱的概率分别10%和90%,赚钱的倍率分别为100倍和0.05倍,赔钱倍率分别为0.9倍和0.1倍。用excel写出几何均值公式(1+100x)^0.1*(1-0.9x)^0.9*(1+0.05y)^0.9*(1-0.1y)^0.1,用规划求解(solver),限制x,y为非负且和小于等于1,解出结果为9.86%和90.14%。这和算术均值最大得出的结论很不一样。

    在有多个投资标的时,几何均值最大原则仍然适用。几何均值最大原则是保持复合增长率最高的原则。不过,和应用凯利公式的潜在风险一样,盲目的使用该原则,破产几乎是必然的。主要原因有两点,第一,对于赚钱的概率、赔率估计是主观的,如果事实和主观预测有出入,当资金分配比例过高时,会导致大赔;其次,投资标的之间可能有潜在的相关性,没有考虑相关性而作出的分析结果本身就是错误的,例如买了同一行业的多只股票,它们之间有相关性。

    所以,投资或者炒股的另外一个基本原则就是巴菲特说的能力圈原则。了解自己的能力圈,且只在里面做事。这样,对于概率、赔率的估计将大为准确,同时也容易避开或利用标的间的相关性。

    几何均值最大原则的另外一个应用是博弈。一个简单的例子是员工和雇主的博弈。假设员工资产10万,雇主身家10亿,如果合作(员工同意被雇用)可以创造10万的价值,那么该如何在员工和雇主之间分配?同样,用excel来进行规划求解。设员工分配x,雇主分配y,那么,员工配合分配的概率是p1=x/10万,雇主配合分配的概率是p2=y/10万。员工不配合分配的概率是1-p1,雇主不配合的概率是1-p2。几何均值公式(10+x)^(1-p1)*10^p1*(100000+y)^(1-p2)*100000^p2。设定规划的限制条件x,y为非负且x+y=10。注意到,只有不配合时(为自己争取),才能得到分配。

    当x+y=10的限制条件时,求解结果x=4.55万,y=5.45万。这符合人类心理,员工身家少,更患得患失,所以和雇主博弈时处于不利地位。

    我们来看当x+y=0.1的限制条件(就是分配1000块),求解结果为x=0.04996,y=0.05004。这也符合客观事实,毕竟这么点钱,员工和雇主都相对不那么在乎(所以,越不在乎的,反而博弈更有利),最终结果逼近算术均值。

    当x+y=1000时,求解结果x=234,y=766。当合作创造价值越高,雇主的优势越大。

    在三方或者多方博弈,一样可以在excel里把几何均值公式写出来,然后用solver暴力求解。不过通常为了简化操作,可以对几何均值求对数,求对数和的极大值。这和所谓的“对数投资理论”道理相通。多方博弈时,需要注意限制条件,另外还得考虑博弈方的相关性(联盟)。这里就不过多展开了,只提出一个现象:多方博弈时,并非总是财富最大方分配额最大,而往往是财富最接近分配总额的方分配额大。读者若有兴趣,自己假设计几个条件,像上例一样变化分配额,很容易就能观察到。这和自然界中的物种生存现象是非常一致的,三个或者更多跨规模的种群间的合作较少见,因为这往往对于最有力的族群没什么吸引力,种群总是倾向于和自己族群规模相当的生存利益争取。

    再来看一看前面deal / no deal的例子,不过这此从博弈的角度看。假设选手身家10万,banker身家10亿,100万就是总分配额。用几何均值最大原则可以得出,x=34.2。没有博弈时是31.6万,由于博弈的引入,选手几何均值提高了。原因是对方也想要分钱啊,比其毫不让步的大自然,有所退让是必然的。所以,如果参与deal / no deal,考虑对手与否也会影响结果。

    几何均值最大化是个非常简单又实用的基本准则,可以应用的范围非常广泛,从炒股、投资,到公司的市场开拓,科学的试验设计,资源的规划调配等等。

    理解了几何均值最大化原则,对于很多经济学的名词如“效用”难免有所抵触。难怪巴菲特总是对经济学家嗤之以鼻。

    最后,感谢阅读文章并加以思考的读者。如前一篇文章所述,反洗脑基因是人类文明最重要的基因之一,万不能看了文章就轻易被说服。尤其感谢回帖,且大加批判、斥责或者非难的读者。写文章本来的目的就是动摇读者的世界观,收获这样的回复,无疑是对自己最大的肯定。特地写下这篇文章,就是为了回馈那些一直不赞同我的观点的读者。

    通宝推:武侯大道,老财迷,rentg,观风望月,伪叔叔,小河妖,决不倒戈,
    • 家园 几何均值最大原则是复合增长率最大原则

      楼主想过没有为什么几何均值最大原则在炒股、投资领域会成为一个实用的原则?deal/no deal中那个穷光蛋真的会拿着别人给的1000元交出自己手中的箱子吗?几何均值最大原则是复合增长率最大原则,这是投资人常用的计算方式。

      投资人算乘法,1到1000与1000到100万距离相等,1000是几何(乘法)均值;普通人算加法,50万是算术(加法)均值。如果一个投资人在这个时候还抱着几何均值最大原则不放,那他真的连一个穷光蛋都不如了。

      穷光蛋是拿不到50万,那只是因为他厌恶风险,保险公司赚的就是这个钱。再回头看看几何均值最大原则为什么在炒股、投资领域会成为一个实用的原则?那是因为投资领域的人都是这么按乘法算帐的。人们总以为自己发现的是客观的规律,其实,有时候看到的不过是自己的影子。就像斯蒂芬霍金以为自己在探索宇宙的奥秘,结果最后发现其实研究的却是自己的思维方式。

      不是想否定几何均值或者对数原则的实用性,只是想探讨一下为什么实用,或许对原则的使用也会有些帮助。

      • 家园 这是一个相对“正确”的原则

        都是个人理解,可能有不足。

        本质上,进化(自然选择淘汰)就青睐几何均值原则。因为进化是激烈的竞争,生存能力最强的活下来---复合率成长率高的意思。

        投资、炒股,本质上是对于资本的自然选择淘汰,也是一种进化过程。某些资本(的组织形式)让它具有优势,这个优势就是复合增长率最高,也就是几何均值原则。事实上,保险、投资、炒股领域,这是比较广泛运用的一个原则。不过,本着有赚钱秘笈绝不外传的原则,知道的人不说。有些人理论上未必知道,但是经验积累已经代替了理论。足球守门员不需要知道引力定律就能守好门。

        我举的穷光蛋的1000块是个极端学术性的例子。因为一个人哪怕身无分文,他这个人本身也是有价值的(不然哪来贩卖人口呢)。一个人的价值可能还不止1000块,例如我们可以用1000块让他冒送死的危险做件事么?多半不可能。(当然用这个方法我们可以试探出他对自身价值的定位。)

        我们假设一个乞丐,对自己定位为1万美金,那么你很容易知道,即便是他,最终也要10万美金才能打发的。用这个方法,可以估计出流浪们对自己的定位---这将是个非常有趣但是又很严肃的社会学问题。

        没有永远正确的真理,任何时刻要运用它,都得仔细思考限制条件和前提。几何均值原则是一个很好的(因为是进化论的推理结果)原则,但不是一个绝对真理(目前个人只认为进化论是绝对真理,但是仍然有必要时刻检验它,我就不敢说在这个宇宙外进化论是否一定有效:只是凭我的想象力无法想象不进化的存在逻辑)。

        谢谢你的好问题,一个好问题胜过一篇烂文章。大多数人在这个问题上必然会有迷惑,而我之前忽略了这个地方,很不应该。

        通宝推:微笑问天,
        • 家园 提到进化论,再接几句。

          有些科普常识的人就知道,地球的历史上,生命体系经历过几次物种的大灭绝和大爆发。年代久远,我们只能在千万年的尺度上做时间的定位,不过,我们还是能反推,在物种的灭绝和爆发之间,更多的时间里,生态系统是一个相对稳定的状态。于是我们大致可以将地球上的生命历史划分为爆发、稳定、衰落这三种阶段。

          很明显,复合增长率最大原则与爆发期的现实状况最为匹配,放到稳定期和衰落期则不是那么地恰当。比对人类的历史,现代资本主义相对中世纪的黑暗的确也可以看成是一个大的爆发,投资人有意或无意识地使用复合增长率最大原则并不是毫无现实根据的自我期望。问题是,爆发期是否会停止,何时停止?如果爆发期结束,投资人是否能自觉地有意识地放下已经使用惯了的复合增长率最大原则。

          你的进化理论只关注生命体系内部个体之间的竞争,从微观上说,当然永远是复合增长率最大的一方胜出。但是,复合增长只是增长的一种可能方式,当现实的环境不再有复合增长的空间,仍还坚持复合增长期望(却无法实现)的一方可能就成了失败者了。炒股的人都清楚把10万变成100万与把10亿变成100亿绝对是两码事,但是我想,没有几个人能在恰当的时机调整自己内心复合增长的期望。

    • 家园 关于圣彼得堡悖论和未婚妻问题

      圣彼得堡悖论我用几何均值方法计算出的答案是出价到第二次掷硬币的结果,就是4块钱。这很符合个人的直觉,

      有一半的几率亏两块,1/4的几率持平,只有1/4几率赚钱。

      最近在思考未婚妻问题,它是由数学家Merrill M. Flood 在 1949年首次提出。问题如下:

      “拒人问题”的数学模型(为了省力,直接抄百度到的《死理性派的恋爱法》)

      为了便于我们分析,让我们把生活中各种复杂纠纷的恋爱故事抽象成一个简单的数学过程。假设根据过去的经验,MM 可以确定出今后将会遇到的男生个数,比如说 15 个、30 个或者 50 个。不妨把男生的总人数设为 n。这 n 个男生将会以一个随机的顺序排着队依次前来表白。每次被表白后,MM 都只有两种选择:接受这个男生,结束这场“征婚游戏”,和他永远幸福地生活在一起;或者拒绝这个男生,继续考虑下一个表白者。我们不考虑 MM 脚踏两只船的情况,也不考虑和被拒男生破镜重圆的可能。最后,男人有好有坏,我们不妨假设 MM 心里会给男生们的优劣排出个名次来。

      聪明的 MM 会想到一个好办法:先和前面几个男生玩玩,试试水深;大致摸清了男生们的底细后,再开始认真考虑,和第一个比之前所有人都要好的男生发展关系。从数学模型上说,就是先拒掉前面 k 个人,不管这些人有多好;然后从第 k+1 个人开始,一旦看到比之前所有人都要好的人,就毫不犹豫地选择他。不难看出,k 的取值很讲究,太小了达不到试的效果,太大了又会导致真正可选的余地不多了。这就变成了一个纯数学问题:在男生总数 n 已知的情况下,当 k 等于何值时,按上述策略选中最佳男生的概率最大?

      直接看完同一篇文章,就知道答案是1/e,即前37%的男士都不考虑,后面只要遇到超过前面最好的一个,就作出选择。

      但是,凡是理解了几何均值的人,都会不由自主的注意到这样一个事实:如果最好的人在前面37%,那么MM将无奈的等待到最后,只能选择最后一个或者当剩女了。而且这样事件发生的概率太大了,37%!

      如果对男士排名,1到n,越高的越好,如果有人去算过几何均值,就会知道,37%概率事件发生后,该MM最终能得到的男士排名(假设越好的男士排名越高)的几何均值只有大概n*37%(又是1/e),连平均水平都不到。

      所以,从几何均值出发,我们应该把未婚妻(或者未婚夫)问题修改一下,不追求最好,但追求几何均值最大。

      我把问题简化一下,假设MM能碰到N个男士,那么她的策略应该是:先观察前面遇到的K个男士,然后用L(L<=K)作为门槛,即从K+1个男士起,若遇到一个男士比前面的(从差到好排序后)的L个男士更好,那么就做出选择。

      现在的问题是,找出最好的K和L,使得MM选到的男士排名的几何均值最高。

      目前我还没想到如何从数学上找出最佳K,L(主要是不能化简,非常麻烦的一大串,哪天写个程序让它自己迭代去算好了),于是只好写了个程序用蒙特卡罗的方法暴力求解。

      蒙特卡罗方法给出的一些典型结果(希望我的程序没写错)供有心人参考:

      N=10(10次选择机会),最优方案是K=4,L=3,即观察前面4个,从第五个起,遇到比前4个里3个都好的(最好的不算),就定下来。

      N=30,最优方案K=11,L=9(这个有点不确定,因为看起来K=13,L=11似乎也差不太多)

      N=100,最优方案K=43,L=39(同上,K=39,L=36似乎也很接近)

      再往下意义其实不大,生活中大概很少会遇到比百里挑一还苛刻的情况。往往会遇到类似百里挑十的情况,参考百里挑一的方法就是了,稍微调整下,例如K/L=40/35可能就是个不错的选择。不用刻意追求数学上的极致。

      最后,想起巴菲特的经典语录:假如人一生只有十次投资机会...我不知道他是否暗示什么,但是从未婚妻问题出发,可以判定前面是需要等待的。投资,最需要的不是内幕消息、聪明的选择,需要的是耐心。

    • 家园 效用理论是依据人的需求而假设数学公式,几何均值的依据呢?

      有什么东西可以证明多个人博弈的时候,实际上大家都会遵循几何均值呢?几何均值的实际意义该怎么解释呢?

      效用理论之所以那么受欢迎,是因为它大概上可以解释人在需求上的一种思考模式。

      • 家园 回复

        我在文章中提了一句,几何均值最大原则是复合增长率最大原则(原谅我把枯燥的数学推导省略了)。所谓复合增长率最大,直白点就是赚钱最快。这是个合理假设,而且是个较为普适的假设。

        效用理论多了不少东西,也无法广泛应用于解释很多现象。例如用效用理论去解释圣彼得堡赌注,得费了死力才能勉强搞个解释出来,此外还很容易被举例驳倒(参考百度圣彼得堡悖论)。而几何均值最大原则,非常简洁明了的一个答案,穷人和富翁结论一样(这里不公布以免打扰有兴趣的读者的专研),还自恰,不会被举例驳倒。

        奥卡姆剃刀原则也指出,简洁的,且更通用的,当然也更接近真理。

        • 回复
          家园 楼主这个研究好像可以用于足球投注。呵呵

          楼主这个研究好像可以用于足球投注。呵呵

    • 家园 请教一下:有没有原著可供学习?
      • 家园 回复

        没有原著,是自己零散看文章加自己经验汇总出来的。当然,原创不是我,有兴趣的可以看看《财富公式》(顺便,理解了几何均值原则的读者没必要阅读,浪费时间而已)。丹尼尔伯努利是第一个真正提出这个原则的人。

        后来,香农的信息论在资产配置上的应用(香农也是投资高手),是在此基础上的延伸。当然,后面还有各种各样的衍生版本,其实,把几何均值原则理解就够了,再有兴趣就是去研究下香农信息论中最基础的信息熵(不要被比特之类的术语吓倒,关键是它背后的基本原则、意义),其余的真没必要,像凯利公式之类其实早已不必要了。

        最后,诸位有兴趣,圣彼得堡赌注是经典的例子(尼古拉·伯努利提出),推荐各位百度一下再用几何均值去研究研究这个例子,这算是过关考试。

分页树展主题 · 全看首页 上页
/ 1
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河