五千年(敝帚自珍)

主题:【原创】预言帝培养指南 -- 淮夷

共:💬61 🌺727 🌵1
分页树展主题 · 全看首页 上页
/ 5
下页 末页
  • 家园 【原创】预言帝培养指南

    点看全图

    外链图片需谨慎,可能会被源头改

    最近端午节,在福建和一个做照明系统的民企老板开会。企业家给我看了一个业绩预测模型,说:预计2012年收入翻倍,之后两年继续保持50%的稳定增长。

    我说:“三年太遥远了,只说2012吧。今年前半年你们工厂实际拿到多少订单?与同行业相比如何?”企业家答:“前半年出口不理想。据我判断,后半年的内销有一个爆发,所以全年翻倍能实现。”

    在工作中我遇到太多这样的企业老板,他们具备多年经验,有人甚至用到复杂的统计模型支持预测,但是,若你观察这些老板给出的企业展望,十之八九都是错的,错的很离谱。因之,我赋予他们一个共同的称谓:预言帝。

    最近我读到一本科普书籍是关于“预言帝”的。此书是2010年出版的畅销书《Future Babble》(未来狂言),作者是加拿大记者Dan Gardner。

    这本书讨论的话题值得人们读一读:专家的预测到底准不准?

    1968年,斯坦福大学生物学家Paul Ehrlich写了一本著名的预言书《The Population Bomb》,卖出几百万册,名噪一时。 Ehrlich对未来10年(70年代)的人口统计推测是这样:全球人口增长过快,粮食供应不足,结构性的矛盾造成世界大饥荒,几亿人口活活饿死。

    Ehrlich预言的末世场景没有发生。从1961年到2000年,全球人口增加一倍,但农业技术“绿色革命”造成粮食生产快于人口增长,人均卡路里反而上升24%。美国人口要应付的并不是什么饥荒问题,恰恰相反,是肥胖症问题。

    话说Ehrlich的人口预言失效之后,开始对金属发飙。1980年,Ehrlich挑了五种金属:铜、铬、镍、锡、钨。他坚信资源稀缺性将造成金属价格上升。经济学家Simon则认为金属价格下跌。两人于是设了一个著名赌局,称作”Simon-Ehrlich wager”,以1980年9月29日的价格为基准点,以10年后的价格为结算点。

    10年一晃而过。五种金属相比10年前全部出现了跌价,锡价的跌幅甚至超过了50%。

    Ehrlich并不是一个孤单的预言帝。

    1952年,英国历史学家汤因比在一个讲座中,预测了2002年,也就是50年之后的世界。

    汤因比认为人类文明遵循某种固定路径,就像你看到一个人的生老病死之不可避免。据此信念,他预测2002年将出现一个“世界政府”统一全球,这是一个政教合一的政府,政府首脑亦是教主。教主彻底剥夺人类物质自由,人类经济活动由政府全盘规划。作为交换,每个人将获得真正的精神满足。

    1952年汤因比提出这个猜想时,他的盛名如日中天,被誉为史学奇才。这个 “世界政府”我听起来像是马克思主义和基督教的奇怪合体,不知汤因比是否看过唐代《推背图》,推背图59象所预测的人类终极形态就是“天下一家,治臻大化。”好在汤因比的展望全部落空,否则过着他预言的这种“物质做奴隶,精神陪上帝”的日子,帝哥你不如早点弄死我算了。

    比汤因比更神奇的是张召忠同志。

    对伊拉克战争,张召忠预言“伊军顽强防御将重创美军。”结果美军轻松逼近巴格达。张召忠修改预言说“伊军将展开巷战,美军将陷入人民战争的汪洋大海。”结果伊军集体投降。

    他对利比亚的预言是“卡扎菲不可能藏在自己的家乡苏尔特”,两天后,卡扎菲在苏尔特的下水道被抓。

    2012年4月,朝鲜火箭发射倒计时。他在电视上讲话,“发射成功概率应该在80%以上。”几个小时之后,火箭化为碎片。

    从统计样本量来说,Ehrlich、汤因比、张召忠,虽然失败方式各有各的神奇,但充其量只是一些孤立的例子,这样小的样本量,也许很难证明,大多数专家都是废物。

    这个反驳颇有道理。不过,让专家绝望的是,宾夕法尼亚大学心理学家Philip Tetlock创设了一个开拓性的社会实验,有力揭示了专家预测的真实水准。

    这个实验始于1984年。Tetlock征募了284位专家,请他们对未来的政经情况进行预测。

    实验的设置是这样:

    1)专家团包括政府官员、经济学家、媒体人士,研判未来政经大局正是他们的日常工作。这些人匿名参加实验,以免在心理压力下预测失常。

    2)每一个预测问题都应有清晰的答案,譬如“请预测印巴5年内会否爆发战争?”就是一个清楚的问题,只有唯一正确解。如果问专家“请预测印巴关系未来5年是否趋紧?”,这就是一个模糊的问题,专家有可能为错误预测找到辩解空间。

    3)对每个事件的预测,须给出0%-100%之间的具体概率,不得使用“很可能发生”、“也许吧“这种含混词语。他们预测的事件跨度,既有短期事件(1-2年内),也有中长期事件(5年,10年)。

    上面的实验设置很聪明,您看得到,完全是为专家量身挖坑。从1984年到2004年,Tetlock用20年时间搜集到了27,450个预测数据点,堪称史上最大规模的专家预测实验。

    Tetlock把这些预测数据和真实发生的事件逐一比对。他发现大多数专家的预测得分都很低,如果他们肯放下专家的身份,随机乱猜一通,平均得分甚至更高。用Tetlock的话总结就是,“专家准确率甚至不如一个投飞镖的黑猩猩的中靶率!”

    另外,测试表现最优的专家也比不上一些简单的计算机算法,比如有一个简单算法就是“不管未来如何风云变幻我都预测没有任何改变”,这个机械的算法应对诸如“未来20年埃及是否继续由穆巴拉克掌权?”这种问题,几乎秒杀全部专家的预言。

    搞笑的是,Tetlock用Google点击率作为指标,测量了这284位专家的知名度。他发现,越有名的专家,预测的准确度越差。

    问题是,人们为何愿意相信这些不靠谱的专家呢?换言之,一个预言帝是怎样培养成的?

    我想最重要的是搞到一个专家身份。97年亚洲金融危机时,有人预测道:“1929年美国大萧条将在亚洲重演,很可能出现国家分裂,继而引发亚洲战争。”两年之后亚洲重焕活力。回到97年,如果我讲出上面的话,也许直接就送北京安定医院了。可这预言的作者是经济学家Paul Krugman(后来的诺奖得主),所以在97年非但不是疯话,而且很有市场。

    其实人类对专家和权威的服从心理在许多实验中都有揭示。譬如1973年南加州大学心理学家Donald Naftulin做了一个实验,请一个演员装成大学教授,给他印了一份假的学术简历,又安排他1小时讲座。

    讲座主题听来高深,是“数学博弈论在教育中的应用”,听讲的是一群蒙在鼓里的教育工作者。演讲稿故意漏洞百出、废话连篇。听众如果根据内容判断,很快就能发现教授是冒充的。但是教授的身份吓住了听众,在讲座后的反馈问卷中,听众纷纷表示赞赏,感觉“这场讲座非常启发自己的思考”。

    1968年亦有一个类似实验。澳洲心理学家请一位剑桥大学访问学者给学生讲三堂课。该访问学者的头衔在每一堂课都不同:讲师、高级讲师、教授。课后要求学生估测这位学者的身高。结果是,头衔每高一级,学生对他的身高估测就相应提高0.5英寸!

    现在不难理解,张召忠在电视上露面时,字幕上一定要不时闪烁“国防大学教授”。

    除了专家身份,预测未来也是一个信心游戏。

    1997年康奈尔大学心理学家Stephen Ceci创设了一个信心实验。春季学期,Ceci用正常的个人风格讲课。秋季学期,他故意换了一个“信心加强版”,譬如用一些有力的手势强调要点,适度调高嗓音,等等。

    春秋两季所讲内容一模一样,唯一差别是传递的信心强度不同。学期结束后,学生给老师打分。 “信心版”的秋季得分大增,从3.5分升到4分(5分制)。学生们的普遍评价是“Ceci老师太有知识了”,尽管事实上该老师的知识一点没变。

    现在,如果您想做预言帝,上面实验揭示的道理也许很有实用价值:你讲的内容一点都不重要,重要的是你必须信心爆棚。

    从这个角度出发,你可能注意到一个奇怪的现象就是:走极端路线的人更易吸引眼球,并成为明星预言家。但是在概率的角度,极端预测更易于出错。这造成一个变态的循环,也就是Tetlock的专家实验所发现的问题:Google排名越靠前的专家越不靠谱,但是越不靠谱的人越出名。

    关于这个现象,1997年荷兰心理学家Giedon Keren做的实验给出很好的证实。

    这个实验请受测者评价两个天气预报员哪一个更出色。预报员对未来4天的下雨概率作出如下预测:

    预报员A 预报员B

    90% 75%

    90% 75%

    90% 75%

    90% 75%

    两人都预测未来4天可能连续下雨,区别在于A的预测更极端(90%概率),B的预测偏于谨慎。实际上,4天中有3天下雨,1天晴天。

    从预测能力说,B给出的概率分布可能是更优的。他和A都测对了3个雨天,而测错的1个晴天,B的偏差不像A的“绝对下雨”错的离谱。

    但是受测人群一边倒的喜欢预报员A。他们认为A“观点清晰、结论鲜明”,B“没有信心、结论无力”。

    基于同样道理,张召忠预测朝鲜火箭使用“80%成功概率”是一种聪明的风格。虽然他彻底猜错了,但是人们打开电视愿意听到的就是极端预言,人们根本不会对“可能也许大概”这种话留下印象。

    现在你“可能也许大概”快变成一个成功的预言帝了。但在最后,你还要掌握一个预言帝的保命秘笈:如何体面的解释自己的错误预测。

    一个好办法就是不停延长自己的预测时限。我预测事件A会发生,虽然它没如期发生,但这不代表以后不发生。我只是弄错了时间,事件A早晚会发生的。所以原则上我的预测是对的。

    这种逻辑挺无敌的。很多有趣的“末世理论”,都有类似的逻辑。譬如19世纪美国有一个信徒众多的米勒派(Millerites),教主是威廉米勒。 米勒认为,1843年1月1日是圣经预言的世界末日。那天太阳正常升起之后,米勒被迫修改了预言:“末日将是3月21日,这一次是按照犹太算法。”

    时钟滴答向前,米勒继续不停的修正他的末世时间:1843年4月23 -> 1843年12月31 -> 1844年3月21 -> 1844年10月22。

    米勒真是太忙了。其实有一个更体面的下台办法,就是所谓的“self-negating prophecy”(自我否定的预言)。简单来说,因为我预言了某事将发生,这造成未来的行为发生某种负反馈,结果该事件反而不会发生。

    最常见的“负反馈预言”就是股评了。我在《Critical Mass》这本书中读到一个很好的例子是关于高盛的股市预测。高盛预言股市要崩盘,但崩盘最终并未发生。于是高盛分析师的辩解是:恰恰因为我们预测了崩盘,造成投资者提前的警惕性减持,从而避免了一场大的崩盘!

    对高盛的理论能说脏话吗?不能。那我没什么可说的了。

    通宝推:衣笠山麓,卢比扬卡,CaoMeng,紧箍奏,一介书生,Leono1,mopfish,醉后何妨死便埋,异域西行,很好很好啊,河虾,all4fun,远航,达雅,foureyes,老爷王,znxf,cctothere,不打不相识,舍瓦,一沙一世界,cid,切地雷,一条溺水的鱼,马尔他之鹰,逐水而行,云意不知沧海,往前走,浣花岛主,夜如何其,陈王奋起,芷蘅,玉垒关2,每周虎,不远攸高,海峰,常识主义者,比翼鸟,希宝,
    • 家园 对专业人士来说任何预测都是废话

      我的意思不是说专业人士能够指出他人的预测里面存在的漏洞进而一一批判,而是说专业人士根本就不会且没必要预测。

      张绍忠可能也是专业人士,但我认为他在电视上说的不一定代表他对问题的真正理解(说句题外话,预测也是建立在对事物的理解上的),只是在不同场合说不同场合最需要的话而已。

      因此,我深度怀疑高盛的所谓预测对他们实际工作的指导意义,换句话说,我认为那根本就是用来忽悠大众、打发时间的。要么他们的内部报告才是说真话的,要么这些预测团队干脆就是个PR部门而已。我相信每一个真正了解金融市场、经济环境的人都不会用模型进行任何预测并因此指导自己的工作,而是通过量度或者感受各种具体指标或者参数,了解目前市场所在的情况并作出对应这种情况最有效的措施。

    • 家园 高盛的手段在江湖术中叫‘两头堵’,原为一种诡辩技巧

      在江湖术则引申指代一类诈骗技巧。

      先来个相声段子

      过年了,是先杀猪还是先杀鸡?

      杀鸡,猪是这样想的。

      杀猪,鸡是这样想的。

      都杀,我是这样想的。

      都不杀,和尚、尼姑们是这样想的。

      相声,来源于市井之中,相声段子、特别是老段子忠实地反映了当年跑江湖卖膏药的那些事。

      不用太高看所谓金融巨头,从本质上来说,他们跟走江湖卖膏药的蒙古大夫没什么区别。

      当然,蒙古大夫们肯定很羡慕‘金融巨子’们可以在全球这么大的‘江湖’卖‘金融’那么高级的‘膏药’。

      可惜,高盛这个辩解一下子把他们的尾巴漏了出来而不自知。

      顺便说一下,淮夷主贴最后一句话也是‘两头堵’。

    • 家园 很靠谱的预言帝培养法

      我承认要预言准确是很难的。但如果允许在结果出来后再回去操弄预言就没问题了。或者作包含很多不同结果的预言也行。

      等等,这不是在作弊吗?

      作弊,谁说的?你一个人说俺作弊 俺就作弊了?如果俺能找十个人说俺没作弊说俺一开始就这么预言的,那又怎么说?什么?你有白纸黑字的物证?你掏出一片纸就敢说是俺写的? 俺这里有十个有博士学位的人各自有一本专著证明你那是栽赃的伪证,怎么样?你说啥? 人间自有公道在?对,正因如此,俺的预言大道才得以彰显!还有啥?俺不可能永久性的收买那么多人?你听好了,俺传预言大道从来不干那蝇营狗苟之事,世世代代给俺说话的都是自带干粮,勤奋学习,兢兢业业的 对俺的预言大道 真学真信真传的 正大光明之士

      呃。。。我这是在说梦话吗?我仔细想了想,其实还是靠谱的。请听我解释。

      一个很靠谱的预言帝培养法 就是自创一门宗教 并自封为教主,转世大神或者最后的先知。在世的时候不顾一切的壮大信众规模。一定要立一本冗长晦涩的经书(最好用火星文夹杂着数学符号写成)。在死之前,同时宠爱几名得力干将但不公开指定继承人 然后声称只有最懂经书的人才是正统 而懂经书的标准就是用经书预言未来(当然做这件事之前首先得有五年左右的专业研读)。最后声称一百年内会有多部伪经面世, 伪经之猖獗将使人们难以分辨自己一直供奉的是否为真。 而辨别真伪的标准仍然是:看预言能力。你瞧,这不是很科学嘛

      数百年或数千年后,大概会有不计其数的“证明”你是预言帝的“证据”,所有的教徒(不管属于教内哪派)都坚信你是宇宙第一预言帝, 并且时时要同有意无意把你的经“念歪”的行径作斗争。就算是不信你这个教的外星人来了,研究了地球人给的资料后,恐怕也会误认为你对地球事务有很强的预言能力 或者至少不能否认你对地球事务有很强的预言能力----因为到那时 在浩如烟海相互矛盾真伪难辨的史料库中 做这件事的难度 可能不比今日的人们要研究孔子屁股上是否有一颗大黑痣 低多少。

      • 家园 呵呵, <Bible Code>就是这样写出来的

        您说的"冗长经书"可谓一语中的. 从圣经里找到29年大萧条\希特勒上台\肯尼迪遇刺这些预言一点都不奇怪,只要一本经书的字数足够多,找到随机字母组合而成后世预言的概率非常之高.

    • 家园 也凑个热闹

      预言好象是大师的事,我等小辈只能谈谈预测.预测确实复杂,造成预测不准的原因可能各有不同,难以一概而论.由于没有看到有关Tetlock实验设计和实验对象的具体资料,对结果不敢妄加评论.但对文中的一些实例有点兴趣,可以结合预测方法发一些马后炮和纸上谈兵的议论.

      用于预测的经验模型包括时间序列模型和因素模型,其中隐含的一个基本假定是"历史总是在重复".但现实是有可能变化的,原有的模型往往不能反映这些状态变化,预测就会失准.例如Ehrlich的粮食供应预测只考虑了"历史总是在重复",而没有考虑“绿色革命”的影响.而对金属价格的预测,只考虑了稀缺性,没有考虑经济周期对需求的影响.很不幸,1980-1990正是美国经济由高走底的十年,他输掉打赌就不奇怪了.

      不是很了解汤因比,依据上述思路可以讨论的是:1950-2002有哪些重大的状态变化影响了人类文明进程以至偏离了汤因比的预言呢?可能的状态变化是这期间的第三次工业革命和农业的“绿色革命”,这些革命使得人类社会在粮食和能源上的冲突有所缓和;计算机和互联网便利了交流,让世界联系更加紧密.

      Krugman的"预言"有两个方面,一是他没有正确估计中国处理亚洲金融危机的力量和决心,以及这种力量和决心可能带来的状态变化对未来趋势的影响.例如,内地对香港直接支持的承诺震慑了索罗斯和流入的热钱;在亚洲各国竞相贬值本国货币之时,中国承诺人民币币值不变.这些措施使得危机恶化的趋势得到了遏制.这种情况下,"预言"失准是情理之中的事.二是他的"预言"客观上有火上浇油的成分,这就不是预测准不准的问题了.

      类似的对状态变化的失查无处不在,可能的原因是没有经验,缺乏数据,建模技术限制,还有就是不愿去"查".人们早已熟知美国次贷问题引起的金融危机.这之前只有高盛暗地里做了准确预测,并及时把手中的烂债券摔给了别人,结果危机出现后引发众怒.为什么只有高盛能准确预测?这确实是个问题!这个问题能解决吗?我很怀疑.试想,问题如果解决了,经济危机不就成了历史吗?但什么样的预测能改变人性贪婪呢?

      叫真起来,有关张先生的预测和高盛的看空反映了预测的另外两个问题,一个是偶然事件的预测和推断;另一个是高不确定情况下,以策略代替预测.这些问题有一定复杂性,在此就不一一展开谈了.

      • 家园 金属价格的赌博输掉了

        还有一个原因是他没有预料到技术进步带来的突变性影响.比如光纤技术取代了铜缆之后直接的造成铜价下降.

        不管是时间序列模型还是合理因素模型还是加入了各种dummy变量的奇怪模型,都没有办法很好做预测. 我觉得原因是第一没有办法捕捉偶然性,第二是这些模型的结构缺陷(比如很多奇怪的虚拟变量只关心历史的关联性而并不必然能够指导未来), 这种模型基本上就是漂亮的垃圾.

    • 家园 历史上有什么成功的预言家吗?

      我想不出一个来,诺查丹玛斯这样的不能算

分页树展主题 · 全看首页 上页
/ 5
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河