五千年(敝帚自珍)

主题:【原创】数字左右社会科学 -- 同人于野

共:💬59 🌺171
全看树展主题 · 分页首页 上页
/ 4
下页 末页
家园 家庭、性格、社会环境是很重要的变量

有什么样的民族或人群,就会诞生出或选出什么样的头,这是跑不掉的。

家园 互惠互利

恭喜:你意外获得【通宝】一枚

谢谢:作者意外获得【通宝】一枚

鲜花已经成功送出。

此次送花为【有效送花赞扬,涨乐善、声望】

家园 呵呵
家园 同意,举个例子

以前在俄国十月革命前,做过一个统计,是新生婴儿出生死亡率的统计,统计数据显示在现代医院的新生婴儿的死亡率远远高于在俄罗斯接生婆手底下的死亡率。如果只看结果的话,可以得出结论,古代流传下来的接生方式比现代医院更优。 但是仔细分析一下,原来当时大部分人都是选择接生婆,只有难产等出了问题才送到医院,所以医院的死亡率比较高。所以统计数据一定要分析,统计指标和方法也要设计合理

家园 人的直觉判断也是一种统计学推理过程

人脑的直觉判断的基础同样是人脑中的以往经验,举一个例子,比如某人决得要不要做某事,

决定于他的社会观察经验,如果他所处的社会中很多人都做这件事,他就很可能会做这件事。

我个人的看法,人脑的推理过程与现代科学里的统计学的推理过程是很相似的,区别只在于

人脑的直觉判断的依据是单个或少数的几个人脑中积累的经验知识,人脑直觉判断的结果取

决于单个人脑后天训练所形成的反射过程。而统计学判断则依据调查统计的数据,统计学判

断的结果取决于所使用的统计学公式。

比较人脑的直觉判断与统计学推理,本质上是没有区别的,为什么统计学结论往往要比人脑

直觉判断要可靠,往往是因为统计学推理所使用的数据都要比单个人脑的经验知识要全面,

数据也要靠谱些,所以得出结论也更靠谱。为什么人脑的直觉判断有时候也很正确,我想也

是可以从一个题目所需的判断数据与判断方法去分析的。

另外目前在自然科学领域,至少在微观物理研究领域,由于微观物理所观察的不确实性,统

计学方法已成为最基本的研究手段,以至于有那么一种说法:一切科学都是统计学。我比较

赞成这种说法。现在的很多社会科学,从它们使用的研究手法来看,还太多依赖于人脑的统

计学结论,从这点上看,它们更像宗教而不是科学。

家园 对以下判断表示怀疑

人脑直觉判断的结果取决于单个人脑后天训练所形成的反射过程

反射过程是怎么认定的?

统计学判断的结果取决于所使用的统计学公式

统计公式是怎么选择的?

由于微观物理所观察的不确实性,... 一切科学都是统计学

“统计”没有改变确定性在科学里的地位。

家园 无量纲化?

感觉还是很怪……

家园 剑宗和气宗

看过同人兄的帖子瞎掰两句:按华山剑派的分法,同人兄应属剑宗,李银河等缺乏数学和理工科训练的应属气宗了。

剑宗的特点是着法清晰有板有眼可是拘于着法,气宗的特点是功夫不到就是大忽悠。

就同人兄所举的例子而言有以偏盖全之嫌。葡萄酒的质量问题本身也许就是与几个随机变量的线性关系。此种情况下,有了数据,回归一下自然皆大欢喜。可现实世界中这么简单的问题又能有多少?太多问题如果要用数字化解决的话,剑宗高手们就只能做太多的前提假设来简化问题。这些前提假设又都囿于剑宗高手自身的数学素养和瞎猜,比如高斯分布或高斯分布的叠加被大量的应用于假设。

另外,剑宗的大兴源于计算机的应用。剑宗的计算离不开计算机。计算机本身就有理论上的能力瓶颈链接出处。此瓶颈在我看来是对剑宗包打天下论的釜底抽薪。

两派各有所长也各有所短。但都不是最上乘武功。如果咱们把眼界放高些,谁也不贬,而是追求:九阳真功+独孤九剑;岂不更美?


本帖一共被 1 帖 引用 (帖内工具实现)
家园 作者意外获得【通宝】一枚

谢谢:作者意外获得【通宝】一枚

鲜花已经成功送出。

此次送花为【有效送花赞扬,涨乐善、声望】

家园 花,您说的那个DI太好了
家园 对统计学持保留态度

红酒的品质究竟和酿制方法有没有关系?看到数字计算能作结论吗?事实上,品质当然和酿制方法息息相关。用错误方法去酿制优质年份的葡萄,得到的产品必然不能遵循统计公式。所以,公式并不能从事实上回答红酒品质的问题,虽然它是一个有效的参考。

法官的判决也是一个诡辩。法律是逻辑的,但是法官依据法律对案件的判决是经验的。对于证据证言的采信,对于量刑的考虑,只能依赖于人的社会阅历和法庭从业经验,假设法官们都熟背法典的话。在这样情况下,量体裁衣的做一份统计,当然比另外找一群人来隔着肚皮猜测大法官们的心思要有效,即使找来的人同样是法律专家。

关于Direct Instruction的例子,在我看来,更多的是介绍了一个,高度细节化和剧本化的教学方法。它能够从多大程度上证明统计方法的优越性,令人怀疑。

人类固然常常陷入旧有的模式,但是当灵光闪现和天才出现时,创造性地工作及被开展,而这正是对过往历史进行统计所不能预知的。

再说两句外行话。现代自然科学,比如基础物理,已经很大程度上依赖于统计学 -- 不是以统计学为研究手段,而是用统计结论作为理论根据。我觉得这是一件让人沮丧的事情,虽然目前看起来无计可施。如果社会科学领域也走这么一条路,将几组数据计算收敛就能有效进行预测,那我们还有多大的热情去挖掘现象背后的成因?

家园 你强调数字,自己却举出不看数字瞎忽悠的例子

> 实际情况是坐飞机比去机场开车的路上要安全的多

This claim is simply wrong.

Yes, airplane is much safer than cars--when we compare the accident rate per vehicle mile. So planes are much safer than cars when covering the same distance. Say, from San Francisco to New York, it is much safer to fly than to drive through the continent.

But if you only drive 10 miles to the airport to take a 10,000 mile flight, you can do the math and find out that a 10 mile car ride is safer than the 10,000 mile flight.

The devil is in the details. LZ just gave us an example of the danger of over-generalization.

家园 I got the math。

You are absolutely right. Thanks!

Keith Thomson: Which is Safer: The Drive to the Airport or the Flight?

So as human beings we all make the same kind of mistakes. This is another example that intuition is not reliable, only numbers tell the truth!

家园 不錯,

統計方法越來越被廣泛的應用在科學研究中了。

例如,在所謂“后基因組”時代,為了研究DNA序列上的變異(例如SNP)與疾病之間的關系,統計遺傳學方法已經成為最主要的方法。不過,這里有兩個問題需要大家注意:

一是如何分劃統計樣本,同樣都是人,多多少少有些病癥出現,那么如何把這個總的population按照phenotype合理地分為兩類?如果病人不幸罹患多種病癥,如何合理采集樣本來使這些不確定因素的干擾達到最小?這在現實的操作中是一個很大的問題。因此,在具體的研究中,為了從權,往往通過調查一個家系(擁有相似的遺傳背景)來確定DNA上的與疾病相關(associate)的變異。但是,合適的遺傳病家系并不好找,因此是寶貴的資源。這也是為什么這樣的研究工作一般總是可以發表在頂尖雜志上的原因。另一方面,家系的population比較小,統計上的variation比較大,可能會有不確定的結果。一些非遺傳而又病癥明顯的疾病的采樣就好辦一些,例如老年癡呆或者帕金森氏綜合征,樣本數量可以達到幾千,那么結果就比較有說服力。

另一個問題,一般我們找到一個變異說它和某個疾病有關聯,其實并非說有了這個變異就一定有病或注定發病。其實差距還是蠻遠的。一個變異與疾病有關的程度可以采用一個概率來描述。在老年癡呆的研究中,最最顯著的基因APOE的變異其實也只有4~20%的概率有病癥。這說明,對統計出來的結果的解釋,一定要非常小心謹慎,否則就會得出“太超過”的結論了

說這兩點,主要還是希望使大家了解統計推斷的過程,以及在實際操作過程中可能會出現的問題。總之,就是要要慎重。

家园 长见识了,

不过, 楼主说的是social science, 而你说的是science.

全看树展主题 · 分页首页 上页
/ 4
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河