五千年(敝帚自珍)

主题:【原创】社会科学的全面数字化 -- 同人于野

共:💬106 🌺360 🌵16
分页树展主题 · 全看首页 上页
/ 8
下页 末页
    • 家园 送花

      这种通过分析海量数据来预测和理解社会问题的方法被人称为 number crunching,现在甚至已经有了专业的公司专门为商业公司干这个事情来预测顾客行为。

      好像也叫Data Mining吧?以前了解过一些。老美已经做得非常成熟了。天朝很快也会有大量的data mining的需求出现,不过老美的软件、算法和经验都需要大量本土化工作。看河里哪一位去赶这一拨发财。

      • 送花
        家园 国内的宝洁很久前就在做这个分析了
    • 家园 我前一段时间做了一个全英国连锁店的数据,

      300多个分店,一年500万条交易记录。

      在控制了几乎所用可见的条件后,筛选出50名超级明星售货员,立刻就提拔成经理。最后的50名,YOU ARE FIRED!以后,连商科都是这么干的。


      本帖一共被 1 帖 引用 (帖内工具实现)
      • 家园 虎大统计玩这么漂亮,花之

        我也要进统计门了,博士阴差阳错跟了个业内搞统计大牛,基本就是要和数据打交道,可怜我高数都没有学过,心肝那个颤啊

      • 家园 问答录

        1. 这是该公司主动要求你或是你所在的公司做的么?

        该公司主动要求,付了很多钱

        2. 是哪个大类的公司? 衣服销售? 还是普通超市?

        不能说具体名字,是日用消费品销售类的全球知名品牌。

        3. 这些明星售货员如何出来的? 难道每一单都会打上售货员的名字? 据我所知, 普通超市应该不会具体去了解售货员名字的吧...

        不是普通超市,每一单都会打上售货员的名字编号

        4. 是用BI软件进行分析的么? 还是就是拿原始数据进行普通的分析?

        STATA SAS

        5. "以后,连商科都是这么干的" ??? what u mean? 大学商科考察学生么?

        不是,以前商科只要定性分析,现在全部往定量分析转。其实,定性分析现在也全是数学,比定量还难(个人看法,有兴趣的朋友搜定性分析统计软件)。就象同仁于野所说的,现在可以对语言和文字进行定性或定量分析。

        6.问题1:一个明星售货员是否也能当好一个经理?经理要管的事可比一个售货员多的多。是否能不用经过经理助理或小组长之类的辅助职位让其锻炼综合管理能力就让其上位?

        在英国,所谓的经理就是你所说的经理助理或小组长之类的辅助职位。而你所说的经理在英国已经可以叫DIRECTOR.对管理层考核,可以用汇总数据,在控制其他条件的情况下,一样可以考核。

        7.问题2:前五十名明星售货员与最后五十名售货员的销售量相差多少?如果相差巨大,那么开除最后五十名自然可以。如果相差只有百分之十,那么开除这些人就是不公平的。

        平均相差300%左右(STD:150%)。这就好像nba职业选手和普通人投篮的差距。

        8.问题3:三百个分店一年500万条交易记录,那么平均每个店一年也就16,667条交易。考虑到店的位置,则其盈利能力必然有差别。那么有些店的销售额其实已经达到其极限。开店在那里的目的无非是保证市场不被对手占据的一个布局而已。在这种店里的售货员的销售额自然比不上繁华地段的售货员。这里有没有加权?

        只随单位变化,不随时间变化的变量(比如说,店的位置等)可以用dummy来代表这种fixed effect. 只随时间变化,不随单位变化的变量(比如说,经济周期或季节因素等),可以用TIME DUMMY来表示。随时间和单位同时变化的变量,大多数这个数据库都包含了。没有的可以到其他数据库找,只要能想到的,肯定都有。为了集思广益,还在企业对经理和员工作了调查问卷。所以,你所说的因素,我们都控制了。

        9.这和《黑客帝国》中的虚拟世界有什么区别?

        没区别。在资本看来,人人都是电池。不过,要想做反抗者,就要做超人,ARE YOU PREPARED?

        10.用计算机放大人类的理性思维,是个好事——但人生不是一堆数据。

        我知道这块牛肉是假的,但是我还是喜欢。

        这不是一个烟斗。

        11.500万条数据的研究成本一般是多少

        一百万人民币,这是2007年在危机前做的。

        这个企业未雨绸缪,现在爽得很。它的竞争对手几乎在2008年都采取扩张政策,就是它根据数据结果关停并转,又提前解雇了一批人员(在经济高涨期解雇员工容易),所以它在危机期间没有裁员。留下的精兵强将,一个人顶几个用,最近全行业亏损,它取得了不错的利润,不仅高升一步,员工工资还都上调了(保留住天才嘛)。这个项目今年还要继续,又可以安排一两个中国博士生的工作,不是皆大欢喜吗?

        所谓管理就是生产力。

        元宝推荐:老马丁, 通宝推:不是老陈,

        本帖一共被 2 帖 引用 (帖内工具实现)
        • 家园 太牛了,中国数据不全

          现在也在靠,

        • 家园 阿西莫夫的心理历史学

          请问系统的预测有多长时间的提前量?需要多少的计算能力?"这个项目今年还要继续"是什么意思?对系统进行改进还是只是对系统的操作?第一年的运行有什么BUG吗?

        • 家园 实际效果如何呢?

          再强大统计分析也只是对以往的经验的提炼,一般只适合比较平稳的社会环境和行业下,

          因为数字是死,人是活的。再高明复杂的KPI体系要对付聪明的人类都欠缺些,对应付复杂多变的环境都是不足的。

          牛肉是好吃,只是吃多了还是会营养不良。

        • 家园 是这样的没错.

          偶接触过尼尔森的市场分析那块,和小虎说的完全一样.超级可怕的数据库,超级可怕的变量相关分析,所有的因子都被控制了,只剩下员工的因素了.将来总有一天会把员工也数据化,然后依照个性能力分析的结果去强化.

          感觉快消品零售业的业绩日益成为一个数学phd掌控的领域,象ipod/iphone这样无法量化,充满创意的东西,以后会越来越难出头.

          创新分为几类,渐变性的,非破坏性的创新下的市场,将会成为人类社会学研究第一块能与物理化学相比拟的领域.

          • 家园 现在火箭队的经理穆雷就是干这个的。

            把球员所有数据都数字化,然后决定球员的未来。

        • 家园 不得不花

          我怀疑这个企业主要是卖成衣的。

          我超最后一个问题的回答。

          赏心悦目,顺流而下。

        • 家园 小虎补充的真妙。

          小虎介绍的方法,在俺们领域是非常普遍的。普遍得基本上写不出能发表的文章了。

          对定性分析补充一下。

          一种是输入数据是定性数据的,甚至是字,词,句,图片,音乐,这个现在有办法处理。

          另一种是输出结论/估计/预测结果是定性数据的,比如说品牌选择,旅游目的地选择,贷款申请合格与否的等,也有现成的模型。

          社会科学的数字化,经济学和商学走在最前面,并且有成熟的趋势。经济学和商学的工作现在直接被统计学家所重视了。搞定性分析的越来越难找到饭碗了。

        • 家园 各个行业都在搞数据库,数据分析等等

          这就是未来发展的方向?科学化?这个感觉总是很夸张,但似乎没有更好的办法,人脑目前的计算机化目前虽然是很机械,但可能总比人脑模糊的主观的分析要好点吧。

        • 家园 9和10痛快!花!
分页树展主题 · 全看首页 上页
/ 8
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河