五千年(敝帚自珍)

主题:【原创】社会科学的全面数字化 -- 同人于野

共:💬106 🌺360 🌵16
分页树展主题 · 全看首页 上页
/ 8
下页 末页
    • 家园 社会科学数字化的困难

      在于人类社会的复杂性跟从之而来的实验条件不可重复性。

      要数字化的前提条件就是所处理的量是可以量子化的。社会科学怎么定量衡量某个人的愤怒程度?怎么样定量衡量一群民众的不满程度?

      进而的问题是,基本原理从何而来?

      自然科学来自五湖四海的科学家们可以为了真理跑到一起来,毕竟没有直接的利益冲突。

      但是社会科学不行,一套体系的建立,会直接影响到社会实践。不可避免就会有各种干扰,从事科学研究的科学家也会出于各种理由篡改自己的公式。公式又由于社会科学的不可重复验证性处于不可确定状态。这是非常危险的。

      • 家园 愤怒和不满都是是很容易量化的,社会科学是一门实验科学

        直接问卷调查就可以量化情绪,那些搞实验心理学的人都是这么做的。

        用统计实验随机测试的方法验证公共政策是一个特别省钱而有效的方法。1993年经济萧条时期,经济学家Larry Katz,认为如果政府花点钱对失业者进行找工作培训(不是技能培训,而是找工作中的面试技巧之类的培训),那么这些失业者可以更快地找到工作,从而减少失业保险的支出。

        于是在很多州进行了随机测试,跟控制组比较下,接受了这种帮助的失业者的确更快地找到了工作。有参议员甚至提出以后凡是公共政策都要先进行这种随机测试。就连实验中使用的面试技巧,也都是通过统计回归方法分析出来的,再把这些技巧教给失业者。

        发展中国家在这种对公共政策的随机测试方面反而出于领先地位,因为测试成本更低。Poverty Action Lab 就是一个2003年创建于MIT专门研究怎么减少贫困的政策的机构。

        某些国家的优势是他们可以测试一些美国政府不能出台的测试:比如印度政府1998年要求1/3的村子的村长必须是女性。而这个选择是随机的。结果证明女性村长更乐于投资那些与女人平时工作相关的基础设施,而男性村长更乐于投资于教育。

        可能最重要的一个这样的测试是墨西哥进行的 Progresa 测试:有条件的给穷人钱。想要得到资助,你必须让孩子上学,怀孕的时候必须检查营养等等,而且钱只给母亲。试验结果极其成功。甚至纽约都开始学了。

        任何一个可以随机的对一群人实行,而对另一群人不实行的政策,都可以进行这种测试。

        • 家园 还可以通过测激素的排放量来定量分析情绪,

          这在幸福经济学中是有先例的。

        • 家园 如果没有更多细节的话,这个结论很难是正确的

          用统计实验随机测试的方法验证公共政策是一个特别省钱而有效的方法。1993年经济萧条时期,经济学家Larry Katz,认为如果政府花点钱对失业者进行找工作培训(不是技能培训,而是找工作中的面试技巧之类的培训),那么这些失业者可以更快地找到工作,从而减少失业保险的支出。

          假如给定总得工作机会数字没有变化,进行找工作培训只能对没有经历该培训的人形成优势,或者不公平。不会减少总得失业人数,也就不能“减少失业保险的支出”。正如下文所说“跟控制组比较下,接受了这种帮助的失业者的确更快地找到了工作。”,但控制组呢?

        • 家园 看过一个量化管理的案例

          说旅店经理要求服务员微笑。结果经理说某某没笑,某某说笑了。那么怎么才笑了没有呢?最后量化为露齿八颗才算笑。

          • 家园 “八颗牙齿”只不过是给出了一个近似的自变量

            但是你能量化八颗牙齿的微笑对客户的心理影响么?

            不能。所以社会科学的数学化障碍就依然存在。

            “八颗牙齿”只不过是给出了一个近似的自变量,但是这个社会科学函数的变量却根本就缺少合适的表达式。

      • -- 系统屏蔽 --。
    • 家园 这两本书有电子版么
    • 家园 支持数据统计

      总有一天我会再开一个大坑从心理学来分析这个的

      最近的工作就是和这有关的

      真的觉得没有什么是不能统计的,只是在于你的模型是否是拥有可靠的基础,即是否是建立在足够的数据量上。

      • 家园 已经写过了吗?

        我非常希望看,特别是心理学的角度。如果有给个链接吧!

    • 家园 咦,回到新兵了?

      借你的题,发我的货。文责不负,其奈我何?

      我有一段时间极其崇拜王晓波,买了市面上所有王的书,爱屋及乌之下也买了不少李银河的书。什么虐恋、同性恋、中国女性的感情和性。。。。恶补了一把性知识。这些书有个共同特点:在我的书架上待不了多久很快被借走。李的书里还是有问卷调查、数据分析的,当然从数学的技术上看比较初级、工具不强。她从事的研究在中国也不容易搞,人有几分迂腐,活的挺累。李翻译的“O的故事”文笔极好,甚至能嗅到外文原文的韵味,是下了功夫的,推荐同志们学习。如果在数学方面没有开窍,社会科学工作者大概也就只能作到这样了。李还是比较可以的,至少保持了基本诚实,资金充足的话应该也可以做不少有价值的工作。社会科学工作者拥有良好的数学素养-这种好事需要大环境。

      我有另一段时间,极其崇拜黄仁宇。除了《明代财政XXXX》,我购买了他市面上所有的书,这些书不大有朋友借。我的看法,黄在精神上,可能没有意识到,已经开始用数学方法研究历史,只苦于不懂现代数学,也缺乏这样大尺度、大纵深的数据。从作论文的角度看费正清的意见是对的,“选题太大,退回重新开题”。Anyway,黄很多提法流于模糊的推测和别扭的新概念,“大历史”,应该是一个大数学模型、一组方程的意思?“不能从数目字上管理”,应该是缺乏有效观察、数据统计和输入-输出控制的意思?大体黄的书关键处有些不清不楚,但是格局很大、气氛很高,体现出天分、经历、性格的力量。因此,黄还是有意思的,普通历史学家就缺点意思,还在黑暗中。另外,《黄河青山》里有些事实很震动人,体现了这样一句名言:“对某件事情,如果我们能说出一些数字,说明我们对它有一些了解,反之说明我们对它没有了解”。我记得的有这样一个比较数据:蒋介石领导下的中国某种钢材一年的产量=日本帝国一天的产量。根据这一数据,基于我几近于零的军事知识,我得出结论:中国不可能战胜日本、或其它工业化列强。从上述结论,我得出推论:近代中国的命运必然由外部主宰。有了这一推论,补充如下实事:近代列强莫不欺负中国,但由于地缘关系,其中只有两个国家对中国有领土野心,大家猜猜是哪两个?有上述推论和实事,我得出定理:近代中国的命运,或者受控于日本、或者受控于俄国。有上述定理,补充等式:在国家利益方面俄国=苏联。。。。。。这个过程有点夸张,但数据和常识确实在缺少正确引导的大环境下改变过我对现代史的看法。

      我现在崇拜西西河很多人,自从读了分形历史学之后,我对同人同志颇为崇拜,因此请将尊臀洗净,让我一脚、加上同志们许多脚把你踢出新兵营。

      已经过了睡觉时间,离题万里,并且已经谈到了日本,索性扯得更远一点谈谈对南京大屠杀的假设?

      算了,睡觉。

      关键词(Tags): #李银河#黄仁宇#社会科学
      • 家园 楼主的公民洗脑指南应该才是经典中的经典啊
      • 家园 你所说的统计,主要是统计总数

        比如说钢产量的比较等等,这些都是总量上的大小比较,是一种宏观上的东西。而我所说的统计方法,主要是用回归分析的手段寻找事情之间的因果关系,可以说是微观的。

        给了足够的数据,使用正确的分析方法,很可能得出的结论恰恰是,左右战争胜负的因素的权重中,钢铁产量是不重要的,而人口基数是非常重要的。比如说我们可能会通过分析古今历史上的100场战争,得到一个左右战争结果的公式:

        胜利 = p*人口 + q *工业 +m*地形 。。。。

        这个公式甚至可能不是线性的。而且这个公式完全由统计给出。你做模型的时候可能给了100个随机变量,而最后得到的结果可能会跟你的直觉大大相反:那些通常人们认为重要的随机变量,比如说钢产量,可能会被发现根本是无关紧要的。这就是数字的力量。

        凭直觉去看数字,不是搞科研。让数字自己说话,才是搞科研。

        • 家园 同意,发现因果

          比如,分析一个地区肺癌发病率和打火机销量的关系,我们得出理论:打火机导致肺癌。而随着观察的持久,我们发现了香烟的存在,于是产生新的因果,逐步稳定下来。

          从我个人的哲学认识来说,统计(指粗陋的数量观察)是比“因果”更加基本的东西,统计创造了因果。或者说,个人的、主要是群体的、长期的观察和统计,导致了我们思想中所有的“因果”。除此之外,并无因果,乃至并无思想。而这种长期的观察统计有动物性的局限,并且大量可能是打火机至肺癌一类,我们习惯了,无有察觉,而科学就在这里慢慢地站立起来。

          关于科研的问题,有关系有人马才是搞科研,没关系没人马搞个pi科研。牢骚很大,sorry。

          关键词(Tags): #认识论#科学#统计
        • 家园 经验是定性,统计是定量

          把各个相关或者可能相关的要素数字化,然后统计大量事件中要素的变化,再通过数学工具找出其中的关联性。其实和大气观测没什么两样。

          不过还是有几个难题,一个是小概率事件--统计上概率很小,所以分析结果靠不住。另一个是博弈问题--规则不能被研究对象知道,不然的话会被利用,特别是中国,这个是国民性。

分页树展主题 · 全看首页 上页
/ 8
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河