五千年(敝帚自珍)

主题:【原创】军情六局M16入驻西西河?(西西河发帖时间调查报告) -- 菜根谭

共:💬87 🌺732 🌵57
全看树展主题 · 分页首页 上页
/ 6
下页 末页
家园 【原创】军情六局M16入驻西西河?(西西河发帖时间调查报告) -- 有补充

结论:文中所分析的ID大多生活于伦敦时区,难道是军情六局M16入驻西西河了?

先声明下,这个分析方法是我在西西河的老河泥里发现了,我只是收集下数据,分析的比较粗糙。

数据来源:https://www.talkcc.org/user/xxxID, 到相应ID家园下,记录最新的100个帖子的发帖时间;不记录日期,只记录时间,而且时间只记录小时,并且向低取偶数。

比如:

• 2024-04-02 04:29:57 记录4;

• 2024-03-21 19:20:36记录18;

• 2024-04-08 21:07:37 记录20;

每个ID只记录开始的100个数据;西西河系统时间猜测是采用了美东时间(EST),后期会做转换与伦敦和北京时间对比;

以下是采集到的源数据表格:

点看全图

然后就是几张分析图。

点看全图

分析1:菜根谭,夜如何其,燕人

这三条曲线具有明显的时间错位;一般人都是在夜间最不活跃,上班之后上午时间最活跃。

菜根谭的夜间是EST 12-18, 最活跃时间是EST 20-22点,对应是北京时间24-6点休息,北京时间 8-10点活跃;猜测菜根谭生活于北京时区;

夜如何其的夜间是EST 0-8点,活跃时间10-12点,猜测夜如何其是生活在美东时区。

燕人的夜间是EST 18-24点,活跃时间EST 2-6,对应是伦敦时间23-5点,活跃时间7-11点,猜测燕人生活在伦敦时区;

分析2:燕人,亚细亚的孤儿,

亚细亚的孤儿活跃时间与燕人强相关,强烈怀疑生活于伦敦时区;

分析3:燕人,中国王申, 既然青春留不住 ,箪食瓢饮到中年, 工业党B站书记

这4个ID活跃时间与燕人相关,也怀疑生活于伦敦时区;

分析4:燕人,一腔诗意喂了狗,我还有机会吗

这2个ID活跃时间与燕人有一定相关,可能生活于伦敦时区。

问题是:为什么呢?为什么呢?为什么呢?为什么呢?

@铁手

通宝推:真理,东方的木头,strain2,崂山一道士,凤城,绿色蔬菜我的爱,newbird,不如安静,大胖子,江南愿,心远地自偏,河兮兮,

本帖一共被 4 帖 引用 (帖内工具实现)
作者 对本帖的 补充(1)
家园 @夜如何其,这个分析是从你的文章得到了部分启发 -- 补充帖

当今局面,西西河如何续命?

并且顺手分析了下你的出没规律,道歉兼致谢啊

@夜如何其

见前补充 4975200
家园 你的意思是若翼德有事则16个ID缺席?
家园 此事必有蹊跷!

元芳,你怎么看?

算了,还是吃个瓜吧

点看全图

匿名 英国人传统社恐, 与人交流只能间接, 所以在河里的人数超过

北美两国加一起的总和。

完美解释。

家园 这个帖子很不好!可能会带来两个严重后果:

1. ID持有者为了掩人耳目,分散发帖时段,被迫延长工作时间,牺牲睡眠,改变部分行为,影响正常生活作息;

2. 需要从有限的经费中支出一部分,来雇人全职或兼职替代自己部分工作,导致个人收入下降。

对个人事业影响巨大,可想见为什么当时被揭穿后反应如此剧烈。

家园 几点进一步的观察

@铁手

1. AI没那么强大,目前看这些ID还是靠人来发帖的,当然了,可能有用AI来产生资料之类的,应该还处于半自动状态;

2. 这些ID基本上就火一段,调动一下河里情绪,过一阵子就销声匿迹换人了,所以啊,可能这个团队并不大,我怀疑也就几个人,还是小作坊模式;

3. 这些ID的活跃时段大概是英国的中午时分;最不活跃时段是北京时间上午11点-下午3点;对比生活习惯来说,看起来更像没成家爱熬夜的年轻人;

4. 这些ID的培养需要河里资深ID的配合和培养,否则不会如此顺利的掀起风波;

5. 这个团队有假左派,假投降派,假台湾派,就是没有大陆派;目前看,目的还是以宣传为主;不过 @夜如何其 的传播学项目说也很有道理。

这里面明显破绽的ID有几个:

1. 是亚细亚的孤儿,这个所谓来宣传文明的台湾ID,应该很清楚了吧?肯定不是什么湖南小镇愤世ID;

2. 有几个ID自称是社会底层,特别羡慕海外和出国,他们的地理位置和他们的人设对不上了。

@铁手

我只是从我的屏蔽名单里找了一部分分析了一下。大家可以用同样的方法分析下自己怀疑的ID。

通宝推:不如安静,

本帖一共被 1 帖 引用 (帖内工具实现)
家园 其实也好解决,用程序把发帖时间设定在别的时间段即可。

目前看来,这个AI还是不够智能化。

家园 为了严谨,建议计算相关性系数

也不枉你这个大学教授ID了😁

家园 为什么一定要上午是活跃时间呢

每个人的工作不同,家庭情况不同,生活习惯不同,那么相应的上网时间也不同。比如我和燕人只差一个时区,理论上我们上网时间应该类似,但是实际情况并不是这样。下图是我3月28日到昨天的发帖纪录,用的是柏林时间,比伦敦时间早一个小时。

点看全图

这段时间我总共发了31个帖子,12点以前13贴,12点以后18贴。

再说伦敦时间(格林威治时间)和欧洲中部时间(柏林,巴黎,阿姆斯特丹,马德里,罗马,伯尔尼)相差只有一个小时。燕人和其他你提到的网友发帖时间有重叠,并不能说明他们就在英国或伦敦。这些人有可能和我在同一时区,也有可能和潜望镜网友一样在不方便透露的某西欧小国。另外的可能是他们在中国工作,上班时间无法上网,下班后上网时间刚好是伦敦时间的上午。

通宝推:既然青春留不住,
家园 【原创】对假日河友的数据整理与分析:加入时间延迟分析 -- 有补充

感谢技术讨论以及 @兰州人 河友的建议,我加入时间延迟分析。

假日河友,我的图实际是个发帖频率图,x轴是时间,y轴是单位时间内发帖数量,你用时间图是看不出来什么的。

我把你的最近100个帖子的数据按照我的分析方法整理了以下,加入到附表中:

点看全图

您和燕人的发帖频率分析图如2:

点看全图

我顺便还用xcorr做了个时间延迟分析。

这组数据有几个观察:

1. 您起床和发帖时间和燕人很类似,考虑到时区因素,您的作息时间比他晚一个小时;

2. 实际上这个图中最有意义的是哪一段时间不发帖,这个才是关键(睡觉时间),可以看到你们都是在23-5点这段时间内发帖频率比较低,这也应该是您的休息时间。

3. 我把你的发帖频率数据对照燕人的数据做了个xcorr分析,可以看到你们两条曲线的时延基本是0(因为我设置的时间分辨率是2小时,所以1小时基本上分辨不出来。)

最后,我把这一组所有数据做了个时延相关分析(请注意,这组数据的分辨率是2小时,误差可能也在正负2小时范围内);

可以看到,如果以伦敦时间为基准;我假设你我燕人和夜如何其的年龄相近,都是比较正常的生活方式。

1. 你和伦敦时间时延是 0±2小时(实际-1小时);

2. 我比伦敦时间 -6±2小时 (提前了)(实际-7小时);

3. 夜如何其时间延后6±2小时(实际5小时);

咱们三个算已知变量,这个分析结果应该可以验证分析方法。

至于分析的这些河友,基本上是比伦敦时间时延在 (2~4)±2 小时;

有几种可能性:

1. 他们生活在美东,但是起的比老王还要早;

2. 他们是爱熬夜的年轻人,所以起床时间比我们这些老年人要晚几个小时;

您觉得哪个可能性大?

至于您说他们下班后发帖,那不可能,看下他们的发帖频率图,他们的发帖是有规律的,活跃期和不活跃期区分明确。核心不是在于活跃期,而是在于不活跃期,不发帖的时候是睡觉的时候!!人可以下班后发帖,总不能睡觉时发帖子吧?

至少可以确认一点,这些ID都不生活在北京时区;

我分析这些ID里,有好几个可是声称生活在国内的。

不知道以上分析是否可信?

通宝推:绿色蔬菜我的爱,河兮兮,心远地自偏,
作者 对本帖的 补充(1)
家园 再加一点发帖规律观察 -- 补充帖

假日河友,你的发帖规律:

1. 上午8-11点发帖较多;

2. 中午有休息时间,发帖较少;

3. 下午3-5点之后再发些帖子;

4. 下午5-6点下班回家;

5. 晚上20-21点还会再下河。

燕人的发帖规律:

1. 早上7点开始发帖,高峰大概7-11点;

2. 没有明确的午休时间;

3. 大概下午3点会离开电脑;

5. 晚上20点会再次下河。

燕人像是只上半天班或work from home.

通宝推:翼德,
见前补充 4975274
家园 为什么不发帖的时候不能是上班时间呢

那几个号称自己是国内网友的ID同时也号称自己混得一般,打工族,非体制内工作,那么他们上班时间难以发帖是符合这一设定的。

另外你有意避开了我提出的,这些ID可能生活在欧洲大陆的可能性,而仅仅讨论他们在美东或国内的可能性。实际上号称生活在欧洲大陆的网友远比生活在英国的多。我能想起来的欧洲大陆网友包括,假日归客,方恨少,潜望镜,黑森县委副书记,缆绳,英国网友包括燕人,切芒果,还有个教授忘记叫什么了。

有几种可能性:

1. 他们生活在美东,但是起的比老王还要早;

2. 他们是爱熬夜的年轻人,所以起床时间比我们这些老年人要晚几个小时;

您觉得哪个可能性大?

通宝推:既然青春留不住,
家园 继续讨论与回复:他们完全可能在欧洲,但是他们宣称是在国内的! -- 有补充

1. 去看下源数据表格,这些河友的每天发帖时间段基本上是在18-20小时左右,如果这4个小时的不发帖时间是他们的上班时间,他们什么时候睡觉呢?难道他们睡觉时还可以发帖子了吗?

2. 我加了时间序列分析,证明他们的活跃时间相对伦敦时间是延迟了(2~4)±2小时,我不太清楚这一段时区是否覆盖了欧洲大陆;

3. 我并没有否定他们可能生活于欧洲,我非常相信他们可能生活于欧洲;但是他们不可能生活于中国。

我找了几个帖子,这几位河友都宣称自己在国内或者台湾高雄的。这和他们活跃的时区不符合。

你要有路子,不如介绍我去中国签证申请服务中心

远远不够,起码显示C段IP

你们海华真有钱

你们出国的人就是目光狭隘

我们玩过游戏的底层农民工都知道


本帖一共被 1 帖 引用 (帖内工具实现)
作者 对本帖的 补充(1)
家园 假日河友,您在这个帖子里的表现令人失望 -- 补充帖

已经失去了一名理工科专业人士的客观性;

如果看不懂这些分析另当别论,你义正词严地说批驳过了,我也正面回答过了。

从你的专业素养,你觉得上述分析是否靠谱,结论是否solid:

我指控的这些自称生活在中国的ID实际是在欧洲/英国。

数据是会说话的!

匿名 此帖显示你果然不具备普通理工科研究生的水平

以前有人指出你在假冒大学教授,我看你赌咒发誓还将信将疑,但是这个帖非常明显体现出来这一点,逻辑漏洞多到已经不是漏洞,已经网都网不住了。难为你一个个帖子数了这么多(先假设你不是觉得大家懒得数而在糊弄大家),我建议你不如分析一下给你宝推的同志或者马甲们的作息规律和你的相关性。

1. 图一中甲乙丙分处不同时区,具有某种作息差异模式,但逆命题和否命题都不天然成立。因为和作息规律相关的,不仅仅是时区,还有工作生活状态。

这个逻辑很好验证。我们拿出一批确定在国内的老ID,比如忙总、萨苏、桥上、和马前卒等等,和自己的作息比一比,看看他们是不是和自己作息严格一致,如果不一致,那么是不是特务就在他们中间?

2. 相关性不是因果性。我们把股票的涨跌趋势图拿来和这种发帖时间做相关,总能找到某个股票涨跌和某个网友活跃有相关(哪怕横纵坐标完全无关),但是然并卵,那只是随机因素造成的。只要候选者足够多,任何两个序列,哪怕完全无稽之谈的两个序列,都可能相关。就图二来说,我敢打赌,如果铁手放出原始数据,至少全站能找到20个ID,和【亚细亚的孤儿】的发帖曲线相关性比【燕人】和他相关性更强。

3. 图三中,燕人明显和其余几个ID发帖规律不同,除燕人外的几个更接近。我推测【他们几个的关系】,和【楼主以及给楼主宝推的几个ID的关系】会很像。建议画一个图三A,为【图三中除去燕人外ID】的曲线;图三B为【楼主以及给楼主宝推的几个ID】的曲线,我们看看是不是两者很相似。【请君入瓮】不仅仅是传说,也可以操作一下的。

4. 即使是不考虑以上所有因素,图四可以看到【我还有机会吗】的发帖高峰(~12)比【燕人】发帖高峰(~8)延迟4小时左右。要么时区不同,要么作息规律不同,不大可能是同一个人。楼主无非是欺负很多网友平时不看数据,觉得摆在一起骗人就能骗到而已。

大家甚至也能从表格里看到,【我还有机会吗】发帖时间和【菜根谭】更接近。北京时间12-22点是两者发帖较多时间,早晨8点前后是两人的次高峰。区别就是【我还有机会吗】发帖时间更扁平,估计作息更不规律,不是能靠发帖挣钱的。

5. 一个人睡觉的时候确实不发帖,但是不发帖未必就是睡觉时间。打工人上班时间是固定的,但是睡觉时间是可以不固定的。数100个帖覆盖了多少天?能不能有的时候早睡有的时候晚睡?有没有考虑周末节假日不上班因素?

总之,楼主的对数据理解分析的低素质一览无余,绝不可能是大学教授,合格的理工科研究生都不可能。如果一定是在高校工作,大概率是成绩不合格无法毕业,但是靠出卖良心换取工作的人。比如当网评员,潜伏大学教师、学生中从事告密工作的辅导员、团委、学工干部这类职业。对学术问题一知半解,却知道怎么拉虎皮扯大旗哄骗无知群众。

可惜西西河有大量真的上过研究生并且能够合格毕业的人,甚至可能是上过很好大学研究生的人,他在这里吹NB吹不响。

我建议 @铁手 开放数据接口,把西西河有史以来的所有ID的发帖时间(西西河记录精确到秒,我看为了省存储空间精确到分就足够了)提供下载,大家可以一起做分析比较,一定很有趣。这样只看某些ID选择性针对打击,对不是靠发帖挣钱,还需要上班,因此没有时间一个个数的网友不公平嘛。

通宝推:ccceee,达菲,既然青春留不住,

本帖一共被 3 帖 引用 (帖内工具实现)
全看树展主题 · 分页首页 上页
/ 6
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河