五千年(敝帚自珍)

主题:【原创】关于西西河发帖和得花的一些统计与分析 -- Adol

共:💬117 🌺1730
分页树展主题 · 全看首页 上页
/ 8
下页 末页
        • 家园 呵呵,过奖了,最开始确实有心想学论文的写法

          但其实还差得远,估计河里的发考题们要见笑了。。。

      • 家园 这个分析真牛啊,佩服佩服
      • 家园 鲜花贬值还有一个因素

        新用户注册送通宝,不排除有人在没钱时注册马甲来砸花或者直接给主ID送通宝。

        可以肯定的是花确实没以前值钱了,夸张点说,早期的花和现在的宝推差不多。

      • 家园 花和宝都不是一开始就有的,

        花是05年初有的,当时是下河浏览20分钟,积累的经验值,才送得起一朵花,所以,很金贵。就因为太金贵了,后来,改为下河浏览10分钟的经验值,能送一朵花。但因为对浏览时间计时的算法,正常浏览一小时,也就够送3~4朵花。所以,05年以后的帖子,可以统计;05年以前帖子,所得的花都是后来翻河泥的,补送的,统计意义应该不很大。

        通宝是06年才有的,开始和花也没什么兑换关系,送花、得花的时候有一定得宝的概论,通宝只能用来宝推帖子。

        后来,因为河友数量和帖子量的增加,以及不少河友用程序挂在河里刷经验值等行为,给服务器带来的负担比较重。终于,老铁改革,2010年8月左右实行铢钱制,通宝、花、铢钱挂钩,1通宝=16铢、1花用1铢、发帖回帖用铢钱等,但送花得宝是赚钱的,不再受经验值的限制,可以大把送花了(开始半年多是完全不受限制的,现在应该是2小时只能送50花),所以,那以后送花就完全是另一回事情了,和前面不好比较。因此:

        ...从此项政策颁布之日起,作为文章受欢迎程度的一个衡量,鲜花立即又贬值了近一倍,仅相当于开河时的不到八分之一。

        你这帖子给了大家一个前后得花的转换标准,但直觉来讲比例可能还要大,尤其是对一些受欢迎的河友来说,比如老萨,开始的帖子也就20、30朵花而已。

        (BTW,积分换通宝是有个通报,但一直就没有真正兑现。后面,因为送花得宝本身一直是良性循环的,而且又陆续走了不少积分高的老河友,就没人关心这事情了)

        关键词(Tags): #送花#通宝
        • 家园 原来花也不是开始就有的,受教了

          还是老河友在这个问题上有发言权

          不过这样一来,我的假设就有问题了:通宝改革前,月得花数和注册人数的平方成正比。

          修正的假设可能是:把2010年通宝改革之前的时期分为两段,有花之后,维持原假设,有花之前,可能的因素是越老的帖子越不容易翻出来送花?这个可以讨论。

          无论怎样,如果不考虑形成线性关系的原因,我所希望的是,至少我对鲜花含金量与时间成反比的估计仍然是有效的,这关系到后面一节的许多结论。

          通宝的存在,以及兑换率问题,我倒没有考虑过,统一都是按照得花数来计算的,但是掉宝率和兑换率,肯定是比送花数更高的。其实这样是合理的,因为帖子总是在增加的,而且不仅送花、宝推需要花钱,发帖本身也花钱。这种慢慢通胀的趋势,对应河里日益增长的帖子数量,我觉得是可以的,如果搞紧缩的话,大家发帖和送花都变得不积极,经济就要下滑了。不知道老铁的掉宝率,过节送通宝等货币政策对西西河帖子经济的繁荣是不是一个灵敏的调控工具。或许为了鼓励原创和回好帖,应该让送花的掉宝率略高于送花花销,而被送花者的掉宝率,更高一些。

          此外,直觉上觉得鲜花贬值更厉害,是对的,后面一节我也会说到,之所以没修正,是有其他的考虑,主要是1、各个板块的热闹程度不同,修正的太厉害,更是只剩下政经板块的帖子了,2不同声望的人也不同,同样水平的帖子,大牛发出来得花大概也会比较多。但是如果没有修正完全,得到的结果仍然会偏向后期的帖子以及河友,我后面的一些结论,就存在这些问题。

          最后,积分换通宝是我笔误了,我的意思是,经验换通宝。我记得经验换通宝是兑现了的,某一天我的经验就没有了,然后大概多出了三十个通宝吧,再加上以前攒的,能有一百出头,现在数量还有所增加。

      • 家园 系的,政策变化!

        当初送花消耗经验值,经验值要靠下河的有效时间来换,所以送花就比较慎重。

        实行通宝本位制后,送花从概率上看,消耗的铢钱小于送花得宝,换而言之,这生意做得!这花就贬值了!

        铁手改制以后,宝推的份量和改制前的送花差不多!肯做赔本生意啊!

    • 家园 【原创】(三)对西西河吸引力的估计

      Adol:(二)“墙”对西西河的影响

      4 对西西河吸引力的估计

      那么接下来,我们想看一看,100个月以来,这944个核心用户是什么时候注册的,西西河经历的各种事件和网站政策的调整,在吸引新的优秀网友加入方面,情况是怎么样的。

      点看全图

      外链图片需谨慎,可能会被源头改

      上图横坐标是时间,以月份为单位,纵坐标是944名核心用户中,当月的新增用户人数。从这个图看起来,仍然是314事件使最多的核心用户注册了进来,包括我,虽然不是这里的一员,也是08年4月初注册的。但是总体看来,核心用户的注册,并没有一个特定的增长或者下降的趋势,最近的一年左右似有下降的趋势,但是这可能是因为许多近期注册的用户还没有达到40000积分的门槛所致。

      注册用户的增加对于月发帖量的贡献,则是显而易见的:

      点看全图

      外链图片需谨慎,可能会被源头改

      这是月发帖量和注册人数的关系,共有100个月,横坐标是944名用户中在当月的已注册人数,纵坐标是当月的发帖数。可以看到,月发帖量和注册人数之间,呈现非常明显的线性关系,至少在2010年7月以前是这样 (p<1.72e-51, t-test)。回归线的斜率是36.4,表明每增加一名核心用户,西西河的月发帖量约增加36.4帖。考虑到老河友的淡出,这个数字可能还要高一些。

      这张图中有两个值得注意的时间点。一个当然还是314事件,另一个是去年被墙的7月。我们看到314事件以后论坛重心的转移,除了少数几个点,并没有使每个用户每个月发帖的数量更多,从侧面支持了之前关于论坛发帖量受到“热点(事件、好贴)驱动”影响的假设。此外,从08年3月到10年7月期间,点与回归线的距离较之前更远,反映了这期间月发帖数量变得更不稳定了。至于10年7月以后,同样可能是因为40000积分的门槛因素,注册用户的增量变得很少,而月发帖数量则有所下滑,所以这张图的尾部也是失真的,这种直线下降的趋势并不符合近一年我们的经验观察。

      为了进一步调查这些注册用户受到河友认同的情况,我们得到了:

      点看全图

      外链图片需谨慎,可能会被源头改

      这是944名河友的声望和注册时间的关系图,横坐标是注册时间,坐标单位是年份,纵坐标是声望。可以看到,10万声望俱乐部,也就是声望的top 5,第一当然是萨苏,然后是忙总,井底望天,葡萄和晨枫。这样的大牛河友是可遇不可求的,没什么统计的价值,所以又放大了左图中声望在10000以下的中小牛的情况:

      点看全图

      外链图片需谨慎,可能会被源头改

      ——仍然是没什么特定的趋势。这一方面反映了西西河在314事件后月发帖量显著上涨的同时,核心用户并没有随之显著上涨——这意味着水质的下降,另一方面反映了在水质有所下降的情况下,西西河仍然有吸引力使许多优秀网友注册进来,西西河仍然很有活力。

      当然,和前面一样,40000积分的门槛仍然可能导致这个图末尾的失真。而这个图尾部的情况,反而是我们很关心的问题,即,从去年7-8月被墙,经过蜀生、媚如春两次事件,还有其他因素的冲击,西西河的吸引力是否有所下降?因为门槛的限制,我们没法对这个问题做出准确的回答,但是从前面同期注册者声望“高低有致”来看,近一年以来注册的优秀用户里面较上层的应该有暂露头角的了,可是从图中,我们没有看到。事实上,从去年被墙恢复(2010年9月)到现在,这段期间注册的用户中超过40000积分的只有7人,最近半年更是一个也没有,再加上后面要提到的近一年来鲜花的贬值因素,我的推测是,情况不容乐观。

      Adol:【原创】(四)西西河通胀问题之研究

      通宝推:妖猫drake,人在旅途,抱朴仙人,舞动人生,领班军机,

      本帖一共被 3 帖 引用 (帖内工具实现)
分页树展主题 · 全看首页 上页
/ 8
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河