主题:【原创】关于西西河发帖和得花的一些统计与分析 -- Adol
共:💬117 🌺1730
对于楼层,我没有收集944名用户以外的信息,对于收藏数量,可能也需要实际访问帖子才能看到。这样在时间上会很长,而且相当于爬下来了所有的帖子内容,不仅对服务器的负担比较大,而且采集行为本身也比只收集帖子的非内容数据(帖号、发帖时间等)更敏感。
或许可以考虑先在花的基础上进行一下筛选,挑选得花比较多的帖子来进一步分析收藏量、宝推量等内容。
另一个问题就是,收藏和宝推的分析,可能一主题为单位比较好
- 相关回复 上下关系8
🙂这分析太牛了! 8 老老狐狸 字254 2011-09-20 10:31:11
🙂嗯,这个有道理 4 Adol 字243 2011-09-20 10:52:10
🙂第一种,河里不少,不断有新的精彩加入,非常有收获 7 老老狐狸 字371 2011-09-20 11:01:49
🙂从我自己的数据里,这个还没法做到
🙂很专业的技术分析,花之 d0lucyduck 字57 2011-09-20 05:54:00
🙂楼主辛苦了 wjcgx 字70 2011-09-17 17:42:36