主题:浅层搜索与深层搜索:一个反教化的实例 -- 秋末冬初
花你的形像比喻
1,整个文章没怎么看懂,好像意思就是60年出生的人,随着年龄的增大,人数越来越多。然后作者以此为据,说××××.其实我认为这正好说明这个数据不可信,82年不可信,90年不可信,00年也不可信。
2,光讨论60年的出生率没有意义,只有把前前后后的若干年的出生率误差一并对照,才好说。看来草根就是草根,做事情这么毛毛躁躁。
3,我想党和政府是基本上知道到底饿死多少人的,但它不说,你有什么招。
4,如果一定要知道真相,我想要么自己当大官,看看当年的准确资料,要么自己拼命活,活到那么一天。
5,这真是一块神奇的地方,可悲又可怜。偏又有人那么愣头愣脑。
还是有明白人呀
其实我认为这正好说明这个数据不可信,82年不可信,90年不可信,00年也不可信
多少良心党和真相党就靠着你的“不可信”的数据,推出来中国饿死三千万四千万五千万N千万~所有对他们的推论表示怀疑的,一律是五毛~
PS:TG的政府不见得真有这么大能,当然,有人愿意它像一九八四的老大哥那样无所不能,那不也是“信仰自由”么,那不也是“TG绝密档案承认三年饿死3750万”的立足点么
我来说说杨继绳数字的推导吧
其实我本帖的根本动机,说的不是具体的数字问题,而是教化与反教化的问题。它的背景正在于用一个今天读者相对远距离的历史“事件”,加借其时政治力量官僚系统以及今天的政治力量既得利益者以及动机之间错综复杂的关系,以不断教化的“解释”来影响读者的“理解”,而又以“解释”来替代“事件”本身。被我说饶了?我这里有一个跟帖,大概表明我看待此类历史的态度。关键是如何理解历史本身
但是现在发觉,即便你不愿意谈,即便你强调的是在“理解”和“解释”之间的争夺,怎样在影响读者对“事件”的把握上发生的斗争,但还是避免不了谈“事件”本身。
那就浅谈几句“事件”。我对这个事件本身,没有确切的准确的把握。原因很简单,我们没有可靠的精准的数字依靠。我同意橡树村长所说的,数字本身不可靠。但我在这一篇的意思,则是三次人口统计的一个有趣的对比则是质疑了这种数字不可靠的原因。则它是有规律的,而且随着时间和政治格局的变化,这个人口普查中“天上掉人口”的“尾巴”会变得越来越大。很有可能我们下一次人口统计,即便59-61年出生的人口数量不再如同前两次人口普查一样天上掉人口越死越多,但如果这个规律管用,那依然很有可能我们会发现59-61年出生的人口死亡率竟然要比前面后面出生年份的都要低。所以积吉河友讲技术上是不可能产生误差的,是人为的误差。我只能...谢谢他这么讲。
这里还有几个相关的讨论,都只是技术层面的。
隔路山贼:经过我的研究,已经有了那三年的比较准确的非正常死亡数据。
好吧。回头谈杨继绳数据的来源。谈他,实属大家讨论中看来已经无法避免。再加上在史文恭的楼里,百丈村长河友一句“[杨继绳]是对包括他亲人在内的死难者的纪念。这就是杨老师的用心,就算他“愚蠢”,也不宜称为“别有”[用心]”令我深受刺激。再加之黑翼炽天使河友已经引用了部分杨继绳的内容,那我们就来说一说吧。
杨继绳主要有两个数据,一个是3600万,一个是7600万。
第一个数据怎样来的呢?根据丁学良讲,杨继绳本书“该书对资料的整理、对数据的比较,非常细致”,还引用了“[杨]1960年代毕业于清华大学,基础扎实”作为佐证,惭愧。
当然,其中“在长达十几年的研究期间,作者在全国饥荒最严重的几个省,包括西北、西南、华北、华东、东北、华南等地的省区收集了大量资料,并面对面地采访了100多名当事人。他收集的资料多达千万字,仅访谈当事人的记录就厚厚的十多本。”这一点是值得称道的,起码那100多名当事人的访谈,如果别人不去重复做一遍,是没有办法反驳的,这是实证研究的优势,毕竟对于历史研究而言,“事实高于理论”。就此向杨继绳“老师”致敬。
事实上,无论左派还是官派还是政府,我从未看到有任何一人否认过那三年有灾荒(这一点杨继绳及其同志倒是极力否认),饿死了人,政策有重大错误。连毛泽东都对大炼钢铁以及大办人民公社正儿八经地认了错(但貌似今天某派同志及网友们穿越往来,坚持或无视都说他没认错)。但貌似今天,认为“(别人)有错误”一直是杨派同志们的专利。持不同意见者肯定是反人道的、无理的、吃人不吐骨头的。
所以说,我对实证访谈部分脱帽致敬,只是作者及其拥趸不一定允许我等脱帽就是了。
但实证访谈是无法归纳出3600万的宏观数据来的。1对1的走访和3600万的宏观数据之间不存在逻辑上的等同。那杨继绳的3600万数据是怎样的出来的呢?按照丁学良的说法,他“比较了几个外国学者对中国大饥荒的重要研究成果”,又“比较了中国国内三位学者金辉、王维志、曹树基的研究成果”,还说,杨继绳“对数据的比较非常细致”。结果呢?如果你通读杨的著作,并认真做笔记的话,你就会发现,其实杨本身并没有做相对于以上作者而言更新更进一步的数据处理和模型处理工作,他做的研究是——
三个国外学者:
美国Judith Bannister: 2987.1万
美国Ansley Coale: 2481万
法国Gerard Calot: 2850.9万
按照丁学良的说法,“杨继绳对这三位学者的研究做了仔细的比较,在此基础上,又比较了几位中国学者金辉、王维志、丁抒、曹树基的研究成果。”
在杨继绳的引述中,这几位学者报告上的死亡数字大概都在3200万-3500万之间。其中王维志的数字最高,在3300-3500万。
而胡星斗的文章中提到“杨继绳先生特别看重王维志的研究成果。强调:“王维志不仅熟悉人口统计理论,还熟悉中国官方人口数据的形成过程。””而杨继绳本人则讲“基本同意王维志的结论”。
如果说杨继绳同志真的做了独立的数据研究的话,那他的研究完全浓缩在不到两个电脑屏幕幅度的精华之中,大家在本贴后杨文链接部分即可看到。基本上只是以上各个学者数据的一个摆列加简单验算。
可见,杨继绳的“细致”的研究基本上就是这么一个过程:
1-首先,找老外(倒是摸透了中国人崇洋惧洋的特点),老外数据大多是2000多万。
2-其次,还有没有更大的?找到几个中国学者,都比老外给出的数据高,于是“细致比对”后,采取了这几个在3200万-3500万之间结论的中国学者的说法。
3-而在这几个中国学者当中,他又因为“王维志不仅熟悉人口统计理论,还熟悉中国官方人口数据的形成过程”而采用了最高的一个3500万的数据,而且还是王数据的上限。
然后,他认为应当加上1958年和1962年(他坚持认为这两年有饥荒),因此,应该有一个增量。所以他无视王算法对前后年份的插值基础,算出了“按各省官方数据”1958年为181万,1962年为42万,共计223万人,则大饥荒饿死人在3500万~3700万之间。取其中数3600万。
然后根据“计算那些应出生而没有出生的人口”(男性河友,请一定不要打手枪啊*),第二个数据,即7600万出现了。
讲完了。总结一下——
杨继绳老师的细致的数据研究方法就是:他搜罗了不少材料,国内的国外的,然后选了数字最大的一群人的研究,再取了数字最大的一个人的研究,然后再取了这个人研究的数字的上限,然后再加上自己的个人调整(加上了1958年和1962年的数据),得出了3600万。再加上没生出来的,7600万。
其中,为了以示不偏不倚,他很“厚道”地在自己的3500-3700万之间取了一个中值。即便为了这个小厚道,他还不忘说“笔者认为,同所有中外学者的数字比较,3600万这个数字比较接近实际,但还是低于实际”。我就不明白,说自己觉得“还是低于实际的”就可以了,讲什么“同所有中外学者的数字比较”啊。不是吗?
此外,为了证实王的个人调整(针对蒋正华1700万数据的调整),同样也为了证实自己后面对1958和1962年数据的“调整”,他还特地指出“王维志...是以他多年的实际经验和亲身体验。。。他是学统计的,...他知道各地报上来的数字是多么不准确,如果用精确的数学工具来处理这些数据,显得滑稽。”看来强调个人出身来让读者相信无论如何得到的东西,的确是大家的习惯。
这的确是一个,按照百丈村长河友的说法,“就算他愚蠢,也不宜称为别有(用心)”的推算方法,也就是丁学良大学者所言的“对资料的整理和对数据的比较非常细致”的方法。
我向这些学者们脱帽致敬。
既然中国的GDP都能按照每年8-10%的增量前进;那么这个死人的数据估计也能同样繁荣。这还得多谢这些学者们的努力,后浪逐前浪。
相同的都是平民出汗,“精英”出话罢了。
我好汗。
其实历史没有前进,我们一直生活在本质上相同的官僚集团当中,只不过他们的数量到底是一个还是多个罢了。
文中提及而未在行文中直接指出的引用:
*注:而且在饥荒之后,生育意愿和生育能力的恢复,都被赤裸裸地无视了。而在这些作者以插值法为基础的算法中,反倒成为了死亡人数正向增加的基础。所以说,“如果用精确的数学工具来处理这些数据显得滑稽”,大家还混什么混啊。
我无意为杨的文章辩驳, 无意为三千万的数字辩驳. 不过, 我觉得你在这一系列驳斥文章中, 有一些误区 --
第一, 统计局的人口数据问题.
在统计局的数据中, 59-62年的人口数和出生率是对不上的, 我在回复 隔路山贼 文章的时候, 已经指出 统计局的人口数据本身就对不上, 或者死亡率被低估, 或者出生率被高估. 这在非正常死亡人口的研究当中是常识, 几乎每篇研究或后人写的综述都提到了这一点. 你还回复了我这一帖. 不知为何被你此处忽视了?
请注意, 统计局的原始数据只此一家, 别无分号. 除非抛开他家的数据不理, 否则无法避开这个问题. 有些数据表面上挺好, 例如积吉:技术上是不可能产生误差的,是人为的误差 引用了一个看上去饥荒中每年都有人口增长的数据来源 http://www.lookinto.cn/theory/1501/, 其实只是在此基础上的一个人为修正而已: 请看这张表后面长长的注释, 饥荒年间处理情况几乎每年都不一样. 其中第8条, 说61年数据直接由公布的60年人口总数乘以公布的增长率 . 所以, 如何处理这个数据悖论, 可能是产生了众多研究, 大家八仙过海各显神通的重要原因之一.
另外关于 82年, 90年, 00年的人口普查数据互相对不上这一点, 你在 秋末冬初:我的补充:三次人口统计的一个有趣的对比 提到了一句"近乎几何般的美感", 暗示政府有根据政治需要修改数据. 据我的猜测, 你指的是82年和90年的对比, 82年有人为的高估死亡率等"作弊因素.
可是蒋正华, 这个1700万所谓官方数字的提供者, 认为82年的数据更加精确可靠. 在杨给他写去质疑数字过低的信后, 他回信指出
由于这一点不涉及杨对蒋的质疑, 可称得上是随口说出. 蒋 + 李, 我认为至少比你的猜测更可靠.
第二. 对其他结论是否采信的问题
你在这方面的态度有两种, 一是过分复杂化, 例如 秋末冬初:为了进一步精准为见, 也不光是你, 例如 雪里蕻:这些事情要搅和起来就细了.
对此, 我想说, 能做得精细当然很好, 但除非你自己做出一个正面榜样, 或者简单一点, 用初步的计算和推理指出忽略某些因素, 将导致已有估计的严重系统性偏差, 而且还是朝着不利于他们结论的方向, 否则这些结果不能被轻易推翻. 我想这是社会科学里数量研究的惯例, 也符合常理, 因为涉及到全社会的统计计算问题, 在细节上, 例如自变量的添加, 例如计量方法的改进, 往往是无止境的. 但粗略的看误差可能正负相抵, 因此这种改进很多时候都不能推翻以前的结论, 只是程度上略有差别而已. 所以, 我不认为你这种挑剔的看法能构成一个有力质疑.
你这篇文章又滑入另一个极端: 过分轻视研究者的功力. 其实上面统计局数据的问题就是一例. 在这里, 你又说
其中的粗体, 未免有些把人看扁了. 提醒你仔细阅读自己所引用的杨文. 他提及的所有研究成果, 都注意到了死亡率和出生率是两个概念, 几乎都是分别估计正常数值和饥荒年间数值, 然后分别得出少生育人口和非正常死亡人口. 他们并没有混为一谈. 另外, 有的研究如王维志, 的确是用出生人口(和自然增长人口)来推死亡人口. 但杨解释说饥荒年间的出生人口相对不易低估, 因为不上报就没有供给指标; 而死亡人口则可能低估. 无论这个理由最终是否站得住脚, 也是一种说法, 并非没注意到逻辑自洽性, 你总不能视而不见吧?
再给你看另外一篇此类研究综述, 以证明这个非常基本的问题一般没有被当时的研究者, 和后来的引用者被忽视 -- 中国大饥荒时期「非正常人口死亡」研究之综述与解读.
最后再次声明, 我不同意杨的结论和很多分析, 更不赞成他的立场. 但杨也不是臭狗屎, 人人踩上一脚. 这样降低的就不一定只是他的公信力了. 只是, 平心而论秋末的这一系列文章思路清晰, 富有理性, 并非是很过分的攻讦之词, 我回你的帖子, 其实还是相信这里能看到更好的讨论.
其实个个主意正着呢,谁说什么都不信。你想,连共产党都不好意思跟酱油党再提“誓将红旗插遍全球”,改“和谐社会”了(这还是共产党吗?)。文人想拿着几篇不着调的小破文章煽动俺们的仇恨情绪、让俺们跟着闹革命,别费心了,洗洗睡吧,等酱油党日子过不下去了再说吧(就如同当年酱油党跟着中共一样)。
还仔细看、认真驳,换了我直接无视,这些人既不能提供个人道德反省的镜鉴,又不能提供科学的思想和知识,认真对待他们的文字完全是浪费生命。
咱家没什么文化,不过知道一句话“士之无耻,是为国耻”。曲学阿世是可耻的。
虽然我不喜欢因人废言
首先多谢你和我的探讨。
其次,我想,你几个问题的产生,可能一部分原因是对我的帖子的用意过于高估了。
我写这一个帖子,依然不是想直接寻求“这个数字”到底是多少的答案。正如我说,我认为在目前的“人口数据”基础上,无法作答。而这一个帖子的目的在于“杨继绳的数据是如何产生的”。
如果你仔细读过了杨文,你就会发现,杨自己也有根据国家统计数据做了计算,也有根据各省统计数据做了计算——而且所有的计算的数值都在2000万的档,没有到达3000万。
但杨没有采用自己的计算。同样,从蒋正华的1700万,到三个国外学者的2000多万,到几个国内学者的3000多万,他都没有采用。用学术研究的角度来说,杨的确列举了一堆文献,他指出了问题*,但他并没有给出明确的解释(只提供了牵强的理由,而且理由基本上都是因为学者“采用了官方的数字”而没有做调整----见王维志的做法),对于同一个题目,为何他没有采信其中任何一个学者的数据的原因(除了他提出蒋正华的数据对不上并做了简单计算之外)。
跟对前面这些给出低于3500万的学者的“沉默无视”不同的是,他跳过了对这些学者数据的评述,直接采信了王维志的3500万数据,也就是他所能获得的数据中最高的。而王的数据,当然你可以说他是自洽的。但他的自洽基于自己对几组矛盾的数据的极富个人特色的判断的基础上。即他的计算的可靠性,在很大程度上基于他个人的判断。
但杨继绳无视前面所有低于3500万的数据,直接采用王的数据。即他既没有交代前面的学者的数据为何他不采信,也不交代为什么王的数据更可靠--而且王的数据很大程度上还得依靠个人判断的调整--除了相当于说“王是专家更可靠”之外,他只是采信之。这个逻辑对于我来说,就是无视所有没有到达最大的数据,而直接抓取了最大的数据。
并且杨还要根据自己的个人判断,加上了58和62两年的数据。
我的这个帖子,就是想给读者展示杨继绳作为当今某派的头牌,他的论断所立足的研究基础是怎样的。我们需要怎样才能成为“有良心的学者”,就好比丁学良在这个基础上依然可以称杨继绳做了细致的数据比对,基本功很扎实等等。
起码从严肃的研究的角度来说,杨一点都不愚蠢,而且很有可能别有用心——针对于百丈村长为杨的辩解。
这便是我帖子的立意。
至于你在这提到的问题,有很多都是直接相关于我对这个数字本身的看法。我说了,我的确没有直接的把握。而且我也并不想直接把自己陷到这个数字里去,所以无论蒋正华也罢,王维志也罢,我都无意直接去剖析他们的数据分析过程。因为正如你所说“但除非你自己做出一个正面榜样”,而根据现今我们拥有的数据基础,我认为我们做不到拨云见日这一点。但质疑是永远有益的。
而且我的判断有我自己的逻辑——虽然在一系列的帖子里,我都不想自己直接把它说出来(所以我感谢积臣)。
如果实在要讨论,我愿意划分为两部分,说说我的观点。
首先,跟你在这个帖子所提到的不同,我是连蒋正华的论断都不信任的。这种不信任,是跟我对1982年的时代背景以及它的统计数据的不信任在逻辑上紧密联系的。秋末冬初:我的补充:三次人口统计的一个有趣的对比。不仅仅1990年人口统计的数据跟1982年的人口普查相比较,它的意外之处有“几何的美感”。1959-1962年的数据有“意外增加之人”,而且与之相较,1956-1958倒是在正常减少。然而即便是2000年的人口普查,它1960-1962年的数据相较1982年,依然有“意外增加之人”,甚至相对于1990年仍然还有“意外增加之人”(如果我们将1961年数据加入死亡率考察,我没有做这一步)。而且1958年又突然少了很多的人口。
我不相信这个数据基础,正如我不相信这个交织延续至今的时代政治、官僚系统的本质。秋末冬初:这就是我在我那个帖子里所强调的秋末冬初:关键是如何理解历史本身
但蒋正华其实也许有意无意中给出了一些细微的线索,正如你也注意到的,他做了一些个人的调整,而且他在回信中也没有告诉杨继绳,为什么要做这个调整。但他说了——“我们的优势是成瑞同志大力支持,提供了三普的微观个人数据”。
重点在于,他这个研究是在1984-1986年间做出的。所以我对它的信任感以及对政治背景的判断,是跟秋末冬初:我的补充:三次人口统计的一个有趣的对比一致的。我并不想把这话直接说出来,现在也不想。
“我们的优势是成瑞同志大力支持,提供了三普的微观个人数据”
那么,第二部分。以王维志的研究为例。他同样也发现了各组官方数据之间的矛盾之处(所有的相关人都发现了),除了他基于个人的判断,实质上低估了死亡率(以58年的为基准)等一系列个人因素的“调整”我不赞同之外,我最大的不赞同,是他们站在对官方数据的怀疑的起点,所做的调整(包括丁、金等人的研究),全部都是基于认为官方数据在极力“抹平”数据这一逻辑基础上。
他们也许有道理,也许是真傻,也许是装傻,我不知道。
但正如我所讲的,相比1982年数据,1990年数据和2000年数据的趋势构成了我对“数据事件”(而不是饥荒事件)的基本判断。这个判断是很有可能成立的,因为距离当事的时间和当事之人已经越来越远。也正如我所说“很有可能我们下一次人口统计,即便59-61年出生的人口数量不再如同前两次人口普查一样天上掉人口越死越多,但如果这个规律管用,那依然很有可能我们会发现59-61年出生的人口死亡率竟然要比前面后面出生年份的都要低”。
那么,他们是有道理,还是真傻,或者装傻呢?各人或许都有自己的判断。但杨继绳的“论证”又给了我们怎样的判断呢?
此外,尽管你不赞同。但我依然认为,不断提出“复杂化”的方法依然是有意义的。尽管正如我所说,我认为在现在的数据基础上,我们无法还原“事件”,但进一步复杂精确的方法依然能够让我们起码在逻辑上产生进一步逼近“事件”的必要条件;同时也能加强我们对现有解释的判断的“质”的基础。而我想说的是,现在正是因为相关人士的研究的“复杂”少了,而不是“复杂”多了。
*这个问题在这套基于“人口统计”的数据的方法中是本质存在的,因为根源上,数据就对不上——正如你说的。
另:对于“生育意愿和生育能力的恢复,都被赤裸裸地无视了”的一段,我是说,对于灾荒年月的生育率和死亡率,都在很大程度上依靠前后年份的插值计算,因为官方数据出现了矛盾。当然,你可以说,他们加上了自己对灾荒年月的判断的调整。但我的意思是,由于同一人群生育意愿和生育能力在时间序列上的平移,使得这个插值法的本身存在问题,尤其是对之后年份的插值方法应用。
只要你也开始试着了解情况, 估计数字, 而不是当一个消费新闻的看客, 就会多少理解这些研究者的做法. 好比实际中的数据往往不是正态分布的, 那么OLS就不用了? 恰恰相反, OLS 仍然是使用最多的方法. 抱着这种立场, 你的那些质疑很多都不成立. 当然, 你如果作为消费新闻的读者, 我完全尊重这样的想法. 杨如果是文宣, 而你只是在反击文宣, 那也挺好.
别的就不多说了, 你的文章写得很好, 花一朵.
鲜花已经成功送出,可通过工具取消
提示:此次送花为此次送花为【有效送花赞扬,涨乐善、声望】。
建议找原书章节看, 才能打到真正的酱油.
二次开发的,加点醋进去不容易看出来.
这些研究者如何处理数据自然有他的道理,不管是正理还是歪理,问题是现在的“真相”与“良心”已经把三年期间的饿死人口变成了“放卫星”“大跃进”,只许往上长,不能往下降,不然就是“否认三年饿死人”“发这样的贴对得起良心吗”“无耻的五毛”“你全家饥荒时统统饿死,你也会替TG歌功颂德”。于是乎,饿死人数越涨越高,而可信的论证却越来越少。
我们不能因为当年的“大跃进”造成了惨剧,就可以在今天用另一个“大跃进”来制造新的谎言。这不是反思,这些疯狂上涨的“饿死真相”不过是为“吹牛受宠,真话挨批”继续地助纣为虐,
这些高举“良心”的旗手,不过是当年“亩产万斤”的孝子贤孙。
你的担心似乎有些多余.
至于整个网络的其他地方, 我不是很在意, 我们自家人说自家话就是了.
统计局的数据问题是研究的难度基础, 却不是终结. 否则很多中国问题都不要搞了.
说是歪理牵强了, 只是基于不同的假设, 富有争议而已.
这些辩论当中的激愤之语, 理他作甚? 这里有谁这么说了?
你们在河里开玩笑可以这么说, 但在实际文献中, 这个趋势好像不存在. 不同的数字, 必然有从大到小的排列.
少出生人口也算进来的确荒谬, 你把它搁在一边就是了, 所有的研究者都同时提供了分开算的数字.
这些高举“良心”的旗手,不过是当年“亩产万斤”的孝子贤孙。
你看到了雪里蕻说ZY真人始作俑者, 就为亩产万斤这件事情完全找到了替罪羊, 恰好所有的数字制造者, 这些说谎专家, 还都和他们是一帮的, 呵呵. 我想说, 河里灌水可不是了解真相之旅啊.