五千年(敝帚自珍)

主题:【整理】最近看了高善文的一个报告 -- Swell

共:💬34 🌺156
全看分页树展 · 主题 跟帖
家园 纯做数据讨论,高善文的有些分析明显有问题

我们都知道高的这篇报告之所以反响非常大,主要就是因为他暗指土共数据造假而且是大幅造假,最近每年高估3个点的GDP,这一下子就让国内外友好人士沸腾了。

我没能力去引申判断数据背后的宏观意义,仅探讨一下其中一些数据结论是否成立。

懒得贴图所以直接文字描述了。4700万城镇失业人口数据的来源是:2021-2023年城镇就业人员数距离趋势值缺口分别为472/2236/2001万,三年累积缺口4709万人。

这里底层数据没有问题,但是三年相加的骚操作相当荒谬,因为纵轴并不是每年的增量而是就业总量。做个类比,假如一个人每年收入突然从100万降到90万,由于收入是增量,可以认为他5年总收入降了50万;但假如一个人资产1亿,因为某突然事件降到了8千万,如果按这个图的算法,趋势值和实际值就会每年差2千万,5年差1个亿,也就是资产归零0,这显然是错误的。按这个图的数据,就该直接用最新一年的缺口值来估计失业人口才对,这就从他说的4700万降到2000万。

第二点是关于GDP降速。原文说:通过比较发生房地产危机国家的前三年和后三年的经济增速,三年平均增速-7%,中位数-3%到-3%,最少也有-2%,而中国经济增速下滑只有0.2%。所以存在大幅造假。考虑到就业与GDP增长存在的正向关系,需要认为GDP增速每年高估了3个点,才能与这几年的4700万城镇就业人口流失对应上。

这个下滑0.2%是怎么算出来的,我大致去拉了一下数据。按历年GDP增速:

年份 GDP增长率

2024 5

2023 5.2

2022 3

2021 8.4

2020 2.2

2019 6

2022-2024相比2019-2021这三年,简单算术平均的话4.4比5.53,怎么也不止是下降0.2。然后报告有说明:2021年GDP用的是两年复合,这样计算下来23年增长率约5.3,再平均差不多是4.5,忽略掉细微差异大概可以跟这个0.2的下滑对得上。

但是为什么这一年要用复合增长率没说,能想到的理由就是这是从疫情年以来的超跌反弹导致数字高达8.4。可如果是这样,那也应该2020年一起复合吧,没理由只把好的异常值下修却保留差的异常值。而如果是修正或者直接剃掉2020年这个最大的异常值,下滑幅度只会更大。

从而假如以公允的态度来统一对待这些异常值,这个算出来的下滑幅度,就要增加1个点以上,达到1.4左右。

这样一算的话,就业人口流失数从4700万变到2000万,而GDP增长率下滑从0.2%增加到1.4%,即使是按照报告里的GDP增速跟就业人口成一定线性关系的逻辑,这个数字并没有太大偏差。

通宝推:审度,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河