五千年(敝帚自珍)

主题:Google与百度的语言处理技术比较 -- vanzolo

共:💬27 🌺40
全看分页树展 · 主题 跟帖
家园 你这个“略见一斑”是一厢情愿

你要研究自然语言,就直接研究自然语言方面的东西。有很多技术手段可以研究,比如参考这个研究百度分词算法的帖子:

百度分词算法详解

别把不相关的东西扯进来。事实上,你自己也能看出来,你的实验根本没有发现什么规律性的东西。

话说当年(现在可能也是,好久没跟踪了)各大网站比较CPU性能,一个必测的项目是用SuperPI这个程序。咱当时也不能免俗,运行了几次,但几次下来就发现了巨大问题:这个程序所计算的时间值是包括IO时间在内的!于是,如果把这个程序放到很慢的盘,比如网络盘上,那么测出的性能就极低。显然,真要用这个测试反映CPU的性能就是一个笑话。一个如此不严谨的测试,在各大网站,包括国外的评测网站,竟然用得不亦乐乎。这真是无可奈何的事情。不过,在任何严谨的研究中,谁要是这么用,显然是不能被接受的。

西西河有那么多大牛发表各种高质量的帖子,我们总不能把西西河的水平降到电脑报这样的水平吧。否则各大牛情何以堪?

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河