五千年(敝帚自珍)

主题:【整理】米国2020大选民调流水账 -- 南寒

共:💬53 🌺284 🌵5
全看分页树展 · 主题 跟帖
家园 9月12日更新

点看全图

离大选又近一周,现在建制派媒体开始给大家吹风,说竞选结果可能得投票日后若干周才能出来。我继续我的文抄公事业,也顺便说两句。

首先,上周和一位河友交流,他提到了RCP(RealClearPolitics)的平均。从PG上看,538算建制派,RCP算中间偏右一点,而且平均的方法有所不同,所以我把RCP也抄上,以免大家以为RCP真的有什么天外之音。这个平均方法的差异我下两个星期有时间再说。

这位河友的一些说法,听起来都很有道理,但是这里有一些“但是”。

第一,什么是平均民调。原帖里说:“但是,平均民调说的是普选票。基于美国独特的选举人制度,特朗普最终赢得大选。”又说“平均民调没有太大意义,最终要看那10来个所谓的摇摆州。”

他这里似乎把平均民调理解成所有州的民调结果的加总,或者用某种方法对各州民调结果的平均。但我抄的平均民调结果是限定在一州以内、在所有民调公司这个维度上的平均。所以他对我这个平均民调的评价是不正确的。

第二,他推荐RCP的平均数以及Rasmussen和Trafalgar的原因是因为,是因为差异都不超过5%。他的前提是“这四个州最终的结果一定非常接近(< 5%,甚至< 1%)”,你如果仔细想想,这个前提并没有被证明就会成立;细节也只能等到以后再说。他还有一句语言的艺术,“所有说Biden领先10个百分点以上的纯粹是扯淡!”这在暗示其它民调里都有10个百分点以上的差异,但如果你去看看538或者RCP引用的各个民调,很少有超过10%的。

第三,他推荐 Rasmussen和Trafalgar的原因是因为两家上次对了,但是一般的技术角度是要看上次为什么对、为什么错,然后再下结论。比如说Rasmussen,这家是连续两次“押”共和党,2012押肉埋里押错了,2016押老床就押对了。

Trafalgar本来就是共和党的店面,这次引进了害羞调节,就经常成了“扣掉一个最高分”其中的最高分。这个害羞调节,是说有支持老床的,民调公司打电话来问你的时候,不管你是一个人在家还是一大屋子的打麻将的、下跑的都巴巴地盯着你让你代表他们,你会感到害羞,不好意思说你支持老床。不管这个场景本身有多少合理性,民调对象因为种种原因不说实话不是什么稀奇的事,而吃民调这碗饭的人要解决这个问题也没有什么神来一笔。问题是你怎么调整,TFG到现在也没说出个所以然来。同时本科生教材里都手把手教了你怎么做。一个经典的例子就是调查你是不是每个星期天早上去教堂,比如说支持老床的这些中下层白人,你要是直接问都会说去。但你要是问教堂的保安,就不一定都看到了。民调的解决方法其实道理上很简单,就是加旁证,多问几个问题。你周六晚上啤酒之夜是不是一直喝到了早上四点、等到了那包免费花生米?回家先揍了同居异性一顿、然后吐了三次,八点才睡安稳。然后是不是十二点一起床就去了自由市场卖后院种的韭菜,一直卖到下午四点市场关门等到了半价的烤面饼子?回去后看橄榄球,从赛前预测到赛后访谈、外加广告,除了上厕所一分钟也没落下。

第四,他又推荐了RMS的总桶支持率调查,不客气地说这大概是PG最明显的化妆色。RMS的总桶支持率,做了个小调整,就是只算被问的当中说要去投票的人,但是传统上共和党投票率比民主党要高,所以其它因素相等的情况下,R的共和党总桶支持率比别的民调都高。你要是把你的取样过程也“相应调整”,用调整后的支持率作为预测选举结果的一个因素,当然也无可非议。但是支持老床的人用这个调整后的数字来宣传他行为、政策在全民范围内有多受欢迎,就有误导之嫌。这里的“相应调整”很重要,因为一般调查总桶支持率,除非到了离选举很近的时候,一般不是为了预测选举结果;目的不同,取样设计也有所不同。

通宝推:桥上,ton,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河