五千年(敝帚自珍)

主题:【原创】哎呀,妈呀,被举报了!(0) -- 奔波儿

共:💬36 🌺338 🌵1
全看分页树展 · 主题 跟帖
家园 【原创】(3)铁手在搞什么鬼?

大家都知道,这个判罚系统是由“一直在改”弄出来的。刚出来的时候,估计用的是简单的线性加权公式,结果问题不少,比如:5个监察的判罚是“不违规”,1个监察则给出了“加重封”,最终结果成了“短封”,这明显是不合理的。记得当时,让大家很是抗议了一番。“一直在改”也虚心接受大家的意见,改动了一通,大家的牢骚渐渐也就少了。背后到底是个什么机制呢?

换言之,G(X)=Y所暗含的G到底是个啥东东?

既然已经知道了X,又知道了Y,就不怕这个G不出来。

先来个最简单的感知器(Perceptron),能出结果,但训练数据和测试数据都有错误,分别为1.25%和9.52%。

换一个,来个流行款的CNN(卷积神经网络),把“tensorflow”这把大牛刀也加上,效果不错,训练数据和测试数据均为100%的正确率。不过,没必要搞这么复杂,而且不好解释。

来个简单的,逻辑回归(Logistic Regression)和支持向量机(SVM),训练数据的误差很小,接近0,但测试数据的误差率还是不佳。看来单层分析的效果不怎么样。

还是用多层分析,比如决策树(Decison Tree),结果不错。无论是训练还是测试数据均达到0误差。上张图。

点看全图
外链图片需谨慎,可能会被源头改

从上面这张图可以看出,在6个监察给出判罚以后,如果“不违规”的次数>=3,则帖子“不违规”。看来这个规矩一直没改。

反之,如果“不违规“的次数<3,则很有可能被判违规,唯一可以逃出樊笼的机会就是”难以判断“,不过,希望比较渺茫。

不过,这张图也反映出铁手的这个判罚系统依旧存在不合理的地方,比如,被投诉贴有太多机会,落入”短封“的陷阱,这明显是不合理的。正常的情况下,应该是“违规”>“短封”>“加重封”。我一直怀疑,铁手在其判罚系统中设有一个调解阈值,乱世用重典,太平岁月,则宽大为怀。

(4)监察业绩之KPI

通宝推:jellobean,故乡在喀什,万年看客,桥上,mezhan,三笑,胡一刀,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河