五千年(敝帚自珍)

主题:【原创】关于西西河发帖和得花的一些统计与分析 -- Adol

共:💬117 🌺1730
全看分页树展 · 主题 跟帖
家园 关于草

收集数据是自己写了程序,分析和统计肯定也不是自己数数了,我主要是用一种统计语言R完成的,R类似于Matlab,但是开源和免费的一种语言,功能上或许打些折扣,但是对我来说已经足够用了。

关于得草数,本来我是打算分析得草和得花的相关性,或者得草和得花和声望的相关性,但是草有很多局限性,首先,出现时间较晚,其次,政策有所反复,即一开始有草,后来又没有,后来又有,第三,草的内涵有较大变化,开始好像和举报几乎等价,而现在则变成了一般性的反对意见,与此相比,送花的态度从开河以来就是赞赏、褒扬,(虽然花在衡量一个帖子的“受欢迎程度”也随时间有所贬值,后面几节会分析),第四,和花相比,草的数量还是很少的,综合这些考虑,通过草的统计所得出的结论的准确性可能不如花。

而且对于我所分析的40000积分以上的用户,其实草多的人还是极少数,而且名字也都是河友们耳熟能详的了,再接下来一部分收草比较多的,据我观察并不是文章或者观点一定有什么错误,而是所关心话题的争议性比较大、或者讨论态度比较差。

这是我对草的一些观察。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河