五千年(敝帚自珍)

主题:【原创】数字左右社会科学 -- 同人于野

共:💬59 🌺171
全看树展主题 · 分页首页 上页
/ 4
下页 末页
家园 谢谢!顺便回应一下楼下

再说说楼主的例子:

红酒的例子,帖子中的统计预测方法用途大概很有限,大概炒酒类股票或许用的上。要是俺做具体采购的,直接的办法就是每地采样,直接测量每次用来酿酒的葡萄的品质。“只有冬季降水量,生长期温度,和收获期降水量这三个因素起到决定性的作用,其他的都可以忽略”这样的结论或许可以揭示的事实是:其实各种品牌的酒的酿造工艺并不像宣传的那么大,主要影响因素在于葡萄的品质。

法官的例子有点意思,俺比较认可。

“固定剧本教课”类似咱们的填鸭式。其优势就在于用较小的成本达到基本的效果。统计能揭示这点,很好。但是迷信数字,一味推广填鸭式,就现代孔乙己了。俺相信中土原来偏向于填鸭式,其实是不得已的办法。建国初期,人才太缺乏了,一个个细细授业解惑太慢了,而且当时的主要任务是在于建设还是很基础的建设,需要大量的能干的,而不是研究型的。当然,现在不同了。

“实际上是家里的游泳池比手枪对孩子危险100倍”--- 其实正是人类对不寻常事件的关注才降低了该类事件的危险性。 要是人类象对游泳池一样忽视手枪的危险性,恐怕就不是“游泳池比手枪对孩子危险100倍”的统计结论了。呵呵。

“我们还总是执着于错误的信念” --- 当大多数人都执着的时候,恐怕他就很可能是对的。如上面手枪和游泳池的例子。不信,你把手枪放在游泳池边,让小孩随便玩玩。俺相信,有极大的概率,先有人被打死了,而后有人被淹死了。当然,也有可能被打中了,又掉进游泳池里淹死了。。。 呵呵呵

家园 好得很

数字是符号而已。解释数字才是更重要的。

家园 统计当然不能滥用,人的因素是相当重要的。

红酒例子的关键,在于有这个公式之前,人们认为红酒十年以后的质量是一个迷,而且很多人凭直觉认为是酿酒方法起重要作用,而统计方法破解了这个谜。

注意这个研究的主题不是为了某一次具体的红酒采购,而是为了给出一个具有一般意义的指导规律。

而你所说的上游建个化肥厂,完全是一个具体的事件,与红酒品质规律无关。这就好比说你不能靠天气变化规律来预测一个装有空调的房间的温度一样。这是高科研和搞具体采购的区别。

而你后面跟贴提到的关于人类思维局限性的辩解我也是不能同意的。枪与游泳池的例子,说的是如果你一个邻居家有枪,另一个邻居家有游泳池,请问你的小孩去谁家玩跟安全?很多人本能的认为去有枪的家庭不安全,这就是局限性。人类思维局限性是固有的,有很多心理实验都证明这一点,当然我们可以给每个具体的例子找一个借口,但这种思维对于怎么提高客观认识世界的能力是没有帮助的。

家园 我主要是感兴趣,写出来总结一下所学,其实也是不务正业啊
家园 有点意思,不过这里的大部分东西说不上是社会科学。
家园 什么东西最好都不要神圣化和扩大化了

红酒的例子中,得出的“具有一般意义的指导规律”,说白了就是(例子中的结论,现实不知道)在其他条件不变的情况下,(因为一般的情况下,其他条件变化很小,如果样本大的话,还会被平均进去。比如100个地点,20年,只有其中1个地点从15年起有了污染,这样还是会得出文中统计结果)红酒的品质与主要与葡萄的品质相关,而葡萄的品质主要与冬季降水量,生长期温度,和收获期降水量相关。

但要知道,这里面的隐含情况是:绝大多数葡萄园没有遭受污染(这里又提出一个统计的局限性,统计会抹杀个体的特殊性,这是统计的优势,也是劣势),并且酿酒工艺成熟并且同质化。上述例子揭示的真正意义恐怕就在于揭示了“酿酒工艺成熟并且同质化”这一情况。至于其他方面的用途恐怕很有限哦。

老兄有空的话,不妨具几个该结论有用的例子。研究毕竟是为了应用,何况还化了不少钱用于数据记录、保存、整理和分析。

想了想,用途应该还包括对促进红酒品质的措施管理。有了这个结论,业界有几个做法:

1. 在保持其他条件没有大的变化下,根据“冬季降水量,生长期温度,和收获期降水量”调整产量,品质不好就少做点?几个因素都是不可控的。

2. 人造小环境,以达到葡萄生长的最优环境。(这个可能最有用)

3. 创新酿造工艺,出产新品,提高工艺在酒类品质的成分。

4. 开展宣传攻势,把“冬季降水量,生长期温度,和收获期降水量”不好年份产的葡萄酒赋予特殊风味的标签,卖高价。

最后,发现连评判标准都很值得商榷。什么是好的葡萄酒? 有人想涩点、有人想苦点、有人想甜点、有人想醇点、有人想清点。。。。

统计的作用俺是一点意见都没有。但是要看到统计局限性的一面。以及统计结果的众多前提,以及统计结果的有限用处。真正科学的态度,在说明一个结果的时候,是要把前提、假设和限制条件说出来的。

另外,枪和游泳池的例子,我看如果人人都不把枪当回事,都让小孩同等的去两家玩,我看去有枪家庭玩出事的比例很快就上来了,未必比游泳池低。(不过统计又需要好多年的滞后,死了N个小孩后,才能发现, 呵呵呵。)

有些事情,真是脚趾头都知道啊。不是一切反直觉的东西都有问题,但是有问题的比例很大啊!!!

常识和直觉 - 是人类千百万年积淀下的宝贵成果,与其他科学手段一样都是人类处理问题的重要工具。偏废一方都是不可取的。另外,不要光强调结果一面,多看看条件和限制。

家园 请教一下

这个红酒质量的单位是什么?排名?打分?

我觉得至少还有一个量重要:冬季降水量 ,葡萄生长期平均温度 ,葡萄收获期降水量都和地理位置有关吧?

家园 呵呵

人的因素是相当重要的

是“人”的就不是统计的,是统计的就不是“人”的。

家园 课后作业:阿扁们的贪污可由以下哪些变量预测

家庭出生、性别、性格、排行、配偶、孩子、教育、天性、政党、社会环境

家园 价格.
家园 直觉是靠不住的

您所说的常识和直觉,也就是目前讨论很热的 conventional wisdom,是相当靠不住的。除了正文说的两点之外,最简单的例子就是很多人认为坐飞机很危险,而实际情况是坐飞机比去机场开车的路上要安全的多。不承认人的思维误区使不能客观的认识世界的。

在几乎所有统计模型与传统专家的较量中,最后都是统计模型取胜。像文中最高法院投票预测这样的比赛只是一个例子,类似的较量还有很多很多。直到现在仍然有很多传统专家拒绝接受这个事实,这只能说明人的局限性。

另外文中红酒质量评价的“标准”是它的价格。搞统计要一切都量化。

家园 量纲不是问题,那几个常数可以是(品质/温度)之类的嘛。
家园 常识和直觉在很多时候是靠的住的

这是一个比例问题。飞机、汽车的例子俺没有太多意见。可能吧。但记住,统计数字掌握在少数人手里。

俺说的是:常识和直觉在大多数时候就是人们辨明是非的法宝。统计数字有时揭示出到道理可能会有点反直觉,但需要细细品位、体会其中的逻辑,再谈接受。除了有人借用不可信的数据、有意忽悠外,统计本身也是有很多局限性的,统计也是由人搞的,有犯错误的可能。统计数据的解释问题更多,同一数据,不同人基于不同倾向,可以读出不同的东东。统计的前提、条件云云,都是限制统计数字用途的相当重要因素。但是,很多时候,谈统计结果时,完全不提统计条件、范围。。。

统计的结果,一定要经过大众和时间的反复检验。统计的条件、范围、办法、出处也是要公开的。

红酒质量评价的“标准”是它的价格== 这就很可笑了。价格可是受市场因素的影响的。市场供求关系,人们口味的变迁、广告费用的支出云云。又牵扯进一大堆因素。真不知道前面的统计是如何进行的?有可能的化,请说说他那么统计是如何进行的,具体的样本范围、数据来源、条件、云云。。。


本帖一共被 1 帖 引用 (帖内工具实现)
家园 关键不在于直觉靠的住靠不住

而是得出“直觉是靠不住的”这一结论依然靠的是直觉。

家园 对,我也碰到这种问题,后来想通了,最终要利用参数的量纲

来中和掉原有的量纲,使得整个函数值是个无单位的常数,或者统一到最常用的容易评价的单位上来,例如,统一到价格上来。

全看树展主题 · 分页首页 上页
/ 4
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河