五千年(敝帚自珍)

主题:【原创】社会科学的全面数字化 -- 同人于野

共:💬106 🌺360 🌵16
全看树展主题 · 分页首页 上页
/ 8
下页 末页
家园 先花再问

如果有这么多商业公司都在运用统计学来分析人的行为,那有没有西方政府在运用统计学来分析他国政府的行为?如果没有在用的话,为什么呢?如果有在用的话,为什么政府决策会出现大纰漏呢?

理论上,如果可以分析别人,那么也就可以分析自己,可以找到自身的漏洞。不过这种分析本身会倒过来影响自身行为,呃……这怎么算?

家园 社会科学定量化的问题在于变量的不确定性

首先,对于社会科学的定量化俺是举双手赞成的。

不过捏

俺是社会学出身,就比较基础的社会学范围而言,存在的问题有两个。

第一,作为定量研究的基础的理想模型,变量是被极度精简的,而涉及行为的影响因素几乎是无限的。两者之间的平衡,一般而言研究者只能自说自话,尽量满足于自圆其说。

第二,作为个体的人的行为,在数量达到一定水平时,行为模式会发生跃迁。也就是说个体的行动者和作为群体的行动者,行为模式不同。而对群体的行为测量比较难。

家园 我前一段时间做了一个全英国连锁店的数据,

300多个分店,一年500万条交易记录。

在控制了几乎所用可见的条件后,筛选出50名超级明星售货员,立刻就提拔成经理。最后的50名,YOU ARE FIRED!以后,连商科都是这么干的。


本帖一共被 1 帖 引用 (帖内工具实现)
家园 还可以通过测激素的排放量来定量分析情绪,

这在幸福经济学中是有先例的。

家园 送花

这种通过分析海量数据来预测和理解社会问题的方法被人称为 number crunching,现在甚至已经有了专业的公司专门为商业公司干这个事情来预测顾客行为。

好像也叫Data Mining吧?以前了解过一些。老美已经做得非常成熟了。天朝很快也会有大量的data mining的需求出现,不过老美的软件、算法和经验都需要大量本土化工作。看河里哪一位去赶这一拨发财。

家园 请教几个问题

我前一段时间做了一个全英国连锁店的数据,

300多个分店,一年500万条交易记录。

在控制了几乎所用可见的条件后,筛选出50名超级明星售货员,立刻就提拔成经理。最后的50名,YOU ARE FIRED!以后,连商科都是这么干的。

问题1:一个明星售货员是否也能当好一个经理?经理要管的事可比一个售货员多的多。是否能不用经过经理助理或小组长之类的辅助职位让其锻炼综合管理能力就让其上位?

问题2:前五十名明星售货员与最后五十名售货员的销售量相差多少?如果相差巨大,那么开除最后五十名自然可以。如果相差只有百分之十,那么开除这些人就是不公平的。

问题3:三百个分店一年500万条交易记录,那么平均每个店一年也就16,667条交易。考虑到店的位置,则其盈利能力必然有差别。那么有些店的销售额其实已经达到其极限。开店在那里的目的无非是保证市场不被对手占据的一个布局而已。在这种店里的售货员的销售额自然比不上繁华地段的售货员。这里有没有加权?

家园 如果数学,计算,分析可以做到这么多。

那我们说不定还真的是生活在matrix里面的吧。

有这么一天,从人受精的那一瞬间的数字关联信息,经过统计或数学计算就知道他的未来吗?同理,算命啊,预测啊,全是科学的?

家园 这和《黑客帝国》中的虚拟世界有什么区别?

http://www.cchere.com/article/730426

用计算机放大人类的理性思维,是个好事——但人生不是一堆数据。

家园 经验不够,欠花一朵!!好文
家园 可以知道的是:

每店年平均交易数: 500M/300=15,000

每店日平均交易数: 15,000/365=400

假设每店1台POS机器,12小时每天营业时间

每店平均成交间隔: 60*12/400=1.3分钟

家园 500万条数据的研究成本一般是多少

现在公司有个类似项目。

家园 尝试回答一下

1 这种连锁店本事管理就比单个店简单些,再加上英国人之间玩办公室政治的可能略少一些。你不妨把这个店看成一个组,不把平日里对店长的认识带到这个故事里来

2 考查了300个店,就算一个店里15个人,也有4500个人了,50/4500 = 1.1% 把店里最差的1%-2 %开除了也没什么问题。如果都差不多,就当杀一儆百了

3 不知道老虎调查的是什么店,熊仔知道有些奢侈品的店,不同地段的货品并不一样,非热门的地方货品价低(不是标价低)

家园 【原创】送花

花任兄的思维方法, 周详圆密.分析问题若只关注于数字及模型,易失偏颇.人们对数字的喜好多半来源于对不确定性的恐惧,就像拐杖不能给盲人带来光明但却能带来稳定.据说服用多巴胺的病人有算得清的感觉,导致输钱,数字有时只不过是更高级的多巴胺而已.长岛的基金经理碰巧是一个数学家,大家津津乐道于数学的威力,雄才大略的老毛碰巧好吃红烧肉,却没人会说红烧肉对革命有巨大贡献.数学是一门语言, 帮助我们表达我们相信的东西.

家园 请教几个问题

因为是接触过类似的一些事,所以想请教......

1 售货员是如何分组的,(比如:同店同组)

2 客单价的多少

3 店内商品毛利率的高低

4 拆迁(这是不可预知的)

这些都会影响到售货员的的销售业绩,如何去掉这些因素的影响?

家园 问答录

1. 这是该公司主动要求你或是你所在的公司做的么?

该公司主动要求,付了很多钱

2. 是哪个大类的公司? 衣服销售? 还是普通超市?

不能说具体名字,是日用消费品销售类的全球知名品牌。

3. 这些明星售货员如何出来的? 难道每一单都会打上售货员的名字? 据我所知, 普通超市应该不会具体去了解售货员名字的吧...

不是普通超市,每一单都会打上售货员的名字编号

4. 是用BI软件进行分析的么? 还是就是拿原始数据进行普通的分析?

STATA SAS

5. "以后,连商科都是这么干的" ??? what u mean? 大学商科考察学生么?

不是,以前商科只要定性分析,现在全部往定量分析转。其实,定性分析现在也全是数学,比定量还难(个人看法,有兴趣的朋友搜定性分析统计软件)。就象同仁于野所说的,现在可以对语言和文字进行定性或定量分析。

6.问题1:一个明星售货员是否也能当好一个经理?经理要管的事可比一个售货员多的多。是否能不用经过经理助理或小组长之类的辅助职位让其锻炼综合管理能力就让其上位?

在英国,所谓的经理就是你所说的经理助理或小组长之类的辅助职位。而你所说的经理在英国已经可以叫DIRECTOR.对管理层考核,可以用汇总数据,在控制其他条件的情况下,一样可以考核。

7.问题2:前五十名明星售货员与最后五十名售货员的销售量相差多少?如果相差巨大,那么开除最后五十名自然可以。如果相差只有百分之十,那么开除这些人就是不公平的。

平均相差300%左右(STD:150%)。这就好像nba职业选手和普通人投篮的差距。

8.问题3:三百个分店一年500万条交易记录,那么平均每个店一年也就16,667条交易。考虑到店的位置,则其盈利能力必然有差别。那么有些店的销售额其实已经达到其极限。开店在那里的目的无非是保证市场不被对手占据的一个布局而已。在这种店里的售货员的销售额自然比不上繁华地段的售货员。这里有没有加权?

只随单位变化,不随时间变化的变量(比如说,店的位置等)可以用dummy来代表这种fixed effect. 只随时间变化,不随单位变化的变量(比如说,经济周期或季节因素等),可以用TIME DUMMY来表示。随时间和单位同时变化的变量,大多数这个数据库都包含了。没有的可以到其他数据库找,只要能想到的,肯定都有。为了集思广益,还在企业对经理和员工作了调查问卷。所以,你所说的因素,我们都控制了。

9.这和《黑客帝国》中的虚拟世界有什么区别?

没区别。在资本看来,人人都是电池。不过,要想做反抗者,就要做超人,ARE YOU PREPARED?

10.用计算机放大人类的理性思维,是个好事——但人生不是一堆数据。

我知道这块牛肉是假的,但是我还是喜欢。

这不是一个烟斗。

11.500万条数据的研究成本一般是多少

一百万人民币,这是2007年在危机前做的。

这个企业未雨绸缪,现在爽得很。它的竞争对手几乎在2008年都采取扩张政策,就是它根据数据结果关停并转,又提前解雇了一批人员(在经济高涨期解雇员工容易),所以它在危机期间没有裁员。留下的精兵强将,一个人顶几个用,最近全行业亏损,它取得了不错的利润,不仅高升一步,员工工资还都上调了(保留住天才嘛)。这个项目今年还要继续,又可以安排一两个中国博士生的工作,不是皆大欢喜吗?

所谓管理就是生产力。

元宝推荐:老马丁, 通宝推:不是老陈,

本帖一共被 2 帖 引用 (帖内工具实现)
全看树展主题 · 分页首页 上页
/ 8
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河