主题:【原创】关于西西河发帖和得花的一些统计与分析 -- Adol
4 对西西河吸引力的估计
那么接下来,我们想看一看,100个月以来,这944个核心用户是什么时候注册的,西西河经历的各种事件和网站政策的调整,在吸引新的优秀网友加入方面,情况是怎么样的。
上图横坐标是时间,以月份为单位,纵坐标是944名核心用户中,当月的新增用户人数。从这个图看起来,仍然是314事件使最多的核心用户注册了进来,包括我,虽然不是这里的一员,也是08年4月初注册的。但是总体看来,核心用户的注册,并没有一个特定的增长或者下降的趋势,最近的一年左右似有下降的趋势,但是这可能是因为许多近期注册的用户还没有达到40000积分的门槛所致。
注册用户的增加对于月发帖量的贡献,则是显而易见的:
这是月发帖量和注册人数的关系,共有100个月,横坐标是944名用户中在当月的已注册人数,纵坐标是当月的发帖数。可以看到,月发帖量和注册人数之间,呈现非常明显的线性关系,至少在2010年7月以前是这样 (p<1.72e-51, t-test)。回归线的斜率是36.4,表明每增加一名核心用户,西西河的月发帖量约增加36.4帖。考虑到老河友的淡出,这个数字可能还要高一些。
这张图中有两个值得注意的时间点。一个当然还是314事件,另一个是去年被墙的7月。我们看到314事件以后论坛重心的转移,除了少数几个点,并没有使每个用户每个月发帖的数量更多,从侧面支持了之前关于论坛发帖量受到“热点(事件、好贴)驱动”影响的假设。此外,从08年3月到10年7月期间,点与回归线的距离较之前更远,反映了这期间月发帖数量变得更不稳定了。至于10年7月以后,同样可能是因为40000积分的门槛因素,注册用户的增量变得很少,而月发帖数量则有所下滑,所以这张图的尾部也是失真的,这种直线下降的趋势并不符合近一年我们的经验观察。
为了进一步调查这些注册用户受到河友认同的情况,我们得到了:
这是944名河友的声望和注册时间的关系图,横坐标是注册时间,坐标单位是年份,纵坐标是声望。可以看到,10万声望俱乐部,也就是声望的top 5,第一当然是萨苏,然后是忙总,井底望天,葡萄和晨枫。这样的大牛河友是可遇不可求的,没什么统计的价值,所以又放大了左图中声望在10000以下的中小牛的情况:
——仍然是没什么特定的趋势。这一方面反映了西西河在314事件后月发帖量显著上涨的同时,核心用户并没有随之显著上涨——这意味着水质的下降,另一方面反映了在水质有所下降的情况下,西西河仍然有吸引力使许多优秀网友注册进来,西西河仍然很有活力。
当然,和前面一样,40000积分的门槛仍然可能导致这个图末尾的失真。而这个图尾部的情况,反而是我们很关心的问题,即,从去年7-8月被墙,经过蜀生、媚如春两次事件,还有其他因素的冲击,西西河的吸引力是否有所下降?因为门槛的限制,我们没法对这个问题做出准确的回答,但是从前面同期注册者声望“高低有致”来看,近一年以来注册的优秀用户里面较上层的应该有暂露头角的了,可是从图中,我们没有看到。事实上,从去年被墙恢复(2010年9月)到现在,这段期间注册的用户中超过40000积分的只有7人,最近半年更是一个也没有,再加上后面要提到的近一年来鲜花的贬值因素,我的推测是,情况不容乐观。
本帖一共被 3 帖 引用 (帖内工具实现)
- 相关回复 上下关系8
🙂我觉得送花消耗要大于的宝吧 2 晨池 字177 2011-09-12 05:01:57
🙂只送花,应当收略大于支!如再大手大脚宝推,肯定就不够了! 老老狐狸 字0 2011-09-12 08:55:40
🙂宝推难道回报率很低吗 晨池 字36 2011-09-12 14:05:15
🙂【原创】(三)对西西河吸引力的估计
🙂我的那个点估计比较好找,嘿嘿 1 妖猫drake 字0 2011-09-20 20:23:20
🙂摸下巴……我好像在最后一张图上找到了自己那个点 路人癸 字0 2011-09-14 11:22:40
🙂LZ的统计好有爱~能否给小白介绍下所用的软件等? Sheldon 字8 2011-09-11 11:17:17
🙂perl和R 2 Adol 字60 2011-09-11 12:43:48