五千年(敝帚自珍)

主题:【原创】数学与战争 -- 晨枫

共:💬192 🌺1004 🌵1
全看分页树展 · 主题 跟帖
家园 算概率

简单的说,就是计算那些信件是否德雷福斯本人所写的概率。

这方面用到文体学的一些知识,最近的一个类似案例是韩寒,网上有个哥们用主成分分析法来计算署名韩寒的一些作品区分度。

他把署名韩寒作品与韩仁均、天下霸唱,郭敬明的作品比较,看区别如何。

初步结论是署名韩寒的作品与郭敬明、天下霸唱的作品区别明显,与韩仁均的作品区分度不高,与韩寒博客的文章也有一定区别。

可惜我们没有的确是韩寒所写的文章样本,不然也可以算出署名韩寒的作品是韩寒所写的概率。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河