主题:新冠疫情源头分析(下篇)——从美国国内疫情数据的角度 -- 逍遥蜀客
接着之前转载的一篇分析新冠疫情源头的文章——从感染率来倒推新冠病毒发源地
前情回顾:
在前两篇文章中,我们首先通过分析总结中国、韩国以及意大利等国家的疫情数据,总结从外输入的疫情发展总是从经济发达的地区开始爆发,一般是经济发达的地方感染率更高,落后的感染率更低,然后随疫情发展,各地感染率由点向面展开。我们在用总结出的规律去分析美国的疫情数据的时候,却发现美国疫情最严重的地方纽约州感染率最高不是纽约,而是一个叫罗克兰县的地方,感染率接近武汉疫情最严重的江汉区的2.5倍。纽约作为经济最发达的地方,在纽约州的感染率居然排不进前五(具体数据参考第一篇文章),然后顺藤摸瓜,把视角放到美国全境的时候,发现很多州都存在这个现象,即各州的首府的感染率往往在本州不算最高,而且普遍是经济发达的地区感染率相对更低,经济不行的州反而感染率高(比如爱达荷州的一个叫Blaine的县感染率超过2%)。
即然美国的疫情数据用境外输入解释不通,我们就试着根据美国的疫情数据推理出美国疫情的真相。
这是美国今天跟新的疫情地图,按州县标识出了各地的感染率,数据颜色标识分五级,我们把所有本州感染率有超过三级以上的州名字用白色字体标注出来。黄色字体标识的州是美国GDP排名前十的但是本州不存在感染率超过三级的州,蓝色横线是美国人口前十的州但本州不存在感染率超过三级的州。
通过这张图我们发现,按常理本应当和疫情相关度最高的经济和人口因素,结果在美国的相关度不高,人口和经济排名前十的州感染率居然有五个州缺席,即美国人口最多经济最发达的十个州,有五个感染率偏低。
和经济、人口不相关,和五大航空城所在的城市不相关(见上篇分析),和华人聚集地不相关(见上篇分析),那会和什么相关呢?
正常来讲,人口聚集的地方疫情传播的快的速度也更快,娱乐业人口聚集较低,那我们看看美国的娱乐业跟疫情数据相关性高不高。
对比疫情数据,相关性很低
如果当一个地方贫困人口多的时候,医疗的缺乏,往往会导致感染率增高。那让我们来美国贫困人口的数据。
我们注意比较美国的贫困县和各地的疫情数据,发现相关性也不高。
我们回到原点,美国的数据经济差的反而疫情感染率高,从事什么行业,会让经济数据表现差呢?农业!经济对农业依赖的地方,GDP普遍高不了。因为第一产业带来的产值是没法跟第二产业第三产业相比的,这也符合我们的常识。即然我们把线索指向了农业,那让我们来看看美国的农业数据。
上图是美国各州农场面积排名前十的表。对照疫情图,发现除了Wyoming(怀俄明州),有九个进入了感染率三级以上的清单。原来,美国疫情跟农业相关度很高。我们沿着这条线索,是不是能找到各州的农业跟疫情的关系。
上图绿色的标识为各州经济对农业依赖,浅绿为非都市区,深绿为都市区。在不考虑美国东北几个州的情况下,美国疫情的感染率跟各地对农业的依赖高度相关。即感染率偏高的地方绝大部分都能找到经济对农业依赖的县。
现在我们以新冠首先在美国农业人口中传播为前提,由于农业人口在美国人口占比较小(小于百分之二,不到三百万),农业人口本身流动性较低,加之农场人口密度低,更加抑制了病毒的传播。
所以我们现在可以解释以下问题:
一、为什么别的国家跟经济人口相关性更高的感染率,在美国则常常看到美国各州经济不发达的地方感染率更高。因为别国是疫情由外向内输入,入境口岸一般在比较发达的地方,所以爆发地和经济人口相关性很高。
二、为什么本该华人更多的地方感染率更高的逻辑却变成了华人更高的地方感染率更低。因为按中国源头说的话,华人多的感染率更高是合理的,但正因为中国不是源头,源头跟美国的农业高度相关,而现在的移民美国的华人从事农业的少之有少,所以各地感染率和华人相关性很低。
三、为什么美国五大国际机场所在城市感染率除了纽约意外都只有二级水平(偏低)。因为感染源是美国本土的农业产业,而美国五大国际机场所在城市经济对农业依赖度不高,所以感染率偏就很正常了。
四、为什么别国传染呈现的是由点到面,美国呈现的是多点开花的状态。由于别国是境外输入,所以输入点感染率更高。美国是本土跟农业高度相关的感染,农业产业的分布是比较散的,所以有多点开花的状态。
五、为什么别国传播速度那么快,美国如果作为源头的话,应该早就积累到一个庞大的数量了。因为疫情源于美国的农业产业,其从业人口本身就少,和别国爆发的大城市相比人员流动性还是人口密度都更低,传播速度天然就要慢的多。
美国从事农业的相关人员更易受新病毒的感染,本质上和我们判断华南海鲜市场是源头的逻辑是一样的。因为这些从业人员天然接触到未知病毒的风险就更高。
现在我们来解释下美国的东北地区的疫情。美国目前疫情最严重的地方,就在东北,疫情的感染率都在三级以上。这是为什么呢?美国人口密度最高的十个州除了俄亥俄州,其余九个都在东北,加上纽约州经济在美国的前三,美国的娱乐业在美国东北高度发达,所以美国东北在美国全境来讲是最适合疫情传播的,这就和其它国家的疫情情况相吻合了,并且纽约市感染率的周边县区疑问在以美国为新冠的源头并且和美国农业相关前提下就能完美解释了。
我们基于美国疫情跟农业高度相关论断,去做一些推理。由于农业的农产品出口运输以海运为主,所以美国海港的感染率会偏高,又由于中美去年的毛衣战,去年美国部分的农产品出口转巴西再出口到我国,所以美国西部的的感染率不高,南部港口的感染率更高。而德克萨斯州南部,路易斯安那州南部,佛罗里达州南部的感染率的疫情图都能解释了。
并且由于农业的特点,存在农忙和农闲的情况。农闲会导致病毒传染率降低,农忙会加速病毒的传染。现在我们就去寻找证据。
上图是美国CDC公布的美国门诊流感样疾病监测网络(ILINet),由于美国年年爆发流感,所以CDC每年都会检测流感季的数据(从10月到新一年的4月在美国称为流感季)。从图中可以看出今年流感的水平在历史上来讲都算高的,可以跟2009年的H1N1和2017年的大流感相比。而跟往年数据不同的是,今年的ILINet曲线在高峰位置走出了从来都没见过的W型。在52周(年底)到达高峰,在然后在今年的第2周第3周的时候探底,然后第5到开始又赢来一个高峰,到第9周又探底,然后到12周又开始升高。流感可不像股市存在做多做空的力量在互相博弈,光用普通的流感不能解释美国今年ILINet的数据。当我们用新冠疫情跟美国的农业相关相关去解释的话,由于农忙时节结束,所以疫情下降,经过四周到了美国的圣诞节,节日的聚集活动让疫情加重,节日结束ILINet曲线又开始下降,等到了农活开始的时候,疫情又开始上升,等到美国开始封城了,疫情又开始下降,我们把曲线出现的高峰和低峰的时间点往前推两到三周,这跟我们刚刚的说明在时间点上都高度吻合,即11月底的农闲,12月底的圣诞,然后二月初农忙开始,3月中旬开始封城。
而且即使把视角放到某一个经济对农业依赖度高的州,也能证明我们的判断
这是北达科它州今年的数据,也符合我们对ILINetW峰值W型的判断。
再来看看往年的数据
而像去年的就没呈现ILINetW峰值W型
并且前年的也没有。
因此,CDC的数据从侧面印证了我们的判断,所有到现在我们可以更大胆的下结论了,新冠就是源于美国,并且和美国的农业高度相关。
现在通过这个结论我们能解释前面的所有疑问,但是中国爆发的为什么是武汉而不是北、上、广、深?由于武汉最早的病例时间追溯到11月份,我们把搜索时间定在11月,搜索关键字定为武汉和农业,令人吃惊的结果出来,在去年11月下旬,在武汉举办了第十六届中国武汉农业博览会
而举办地武汉国际会展中心距离华南海鲜市场不到5公里,乘坐公交车时间不过15分钟,如果美国从事农业参展商来了武汉在汉口坐车,会不会参观下和自己行业高度相关的华南海鲜市场呢?而这样的逻辑是不是更加合理,可能性更大?
后记:在写新冠疫情源头的系列文章的时候,几次都想放弃,作为理科生缺乏文字功底,写这么长的文章本来就够吃力了,本来英语水平就够呛但为了保证资料、数据的真实性,又要翻阅大量的英文网站,加上你懂的原因英文网站的访问速度经常让人感到崩溃,但是每每看到墙外的跳梁小丑侮辱我们中国肺炎武汉肺炎的时候,心里就感到不忿。武汉作为病毒的受害者,为控制疫情做出的巨大牺牲,本该享受鲜花和掌声,却要承受着不该属于她的侮辱和歧视。为了因疫情牺牲的英雄,为了大家配合防控疫情所做的努力,我都不能选择放弃。新冠疫情源头的真相应该被大家知道,武汉和湖北为中国为世界做出的牺牲应该被知道,美国甩锅的无耻嘴脸更应该被知道。
=========================================
农业博览会的路径推测有一个大BUG:
参加农博会的国内人员来自各省各市,如果是农博会传播的,疫情在武汉农博会后不应该只在武汉爆发,而应该在国内呈现出多点开花的情势才合理。有关部门应该查一查其他各省的早期确诊患者中有多少是有过农博会参会经历的。
- 相关回复 上下关系8
🙂新冠疫情源头分析(下篇)——从美国国内疫情数据的角度
🙂待认可未通过。偏要看
🙂那些数据可是实打实的,这都不能作证据? 2 逍遥蜀客 字190 2020-04-19 22:39:25
🙂不客气地说一句:完全匪夷所思 17 南寒 字1380 2020-04-18 13:03:30
🙂最近河里仅是这些ID 5 南宫长万 字129 2020-04-19 03:13:03
🙂阴谋论还有一个固定套路,是提出一大堆问题 6 AleaJactaEst 字443 2020-04-19 06:21:00
🙂作者的逻辑是从统计学差异上来进行推导,并未论证其内在根源 4 逍遥蜀客 字238 2020-04-19 01:08:21
😄您这个“其实”和他那个“即”一样销魂 南寒 字0 2020-04-19 10:40:18