五千年(敝帚自珍)

主题:【原创】百度和Google,谁更强大,为什么? -- 邓侃

共:💬168 🌺346 🌵1
分页树展主题 · 全看首页 上页
/ 12
下页 末页
        • 家园 刚进来的时候水土不服啊

          现在google已经好用多了,google.cn搜出来的默认就是中文的,不过google刚进来的时候不是这样,很多人用到头也不知道点中文网页,虽然已经够显眼的了,要不咋说人懒呢,多一下都不点。

      • 家园 三达不留点,股沟,

        我想查个华硕主板,把型号打到股沟,头几页全都是英文,看着太闹心了,累挺。打到百度,哪怕说我输入的一个中文没有,也照样给我一大票国内网址,想查个外国的都没有。百度的意思很明确,您英语这么好,百度很难满足你的要求,请到隔壁股沟。我查国外的资料肯定用股沟,查国内的肯定用百度。而且百度自己GFW,可以很方便的推出网页快照,Very Good。这个股沟就吃亏了。

        说得好。对市场切分,专门处理,这个方面,百度的确做得更好一些。

    • 家园 【原创】关于几个技术问题的说明

      1.关于Precision和Recall

      Precision和Recall在信息检索的不同应用中,难度是不一样的。打个比方,在电子图书馆中检索就比在互联网上搜索页面容易。电子图书馆里的内容是静态的,规范的,而互联网的内容是动态的,不规范的甚至是恶意的。比如说有的好网页在文法上很烂,用词错误,断句错误。因此搜索引擎在建立索引时会发生错误。或是说有的垃圾网页恶意的重复关键字,借以达到排名靠前的目的。

      度量相关度有一些常用参数--比如说DCG/NDCG。在测试时,只有类似的系统相互比较才有意义。谈到通用搜索引擎,我们一般会比较GYMA(Google/Yahoo/MSN/Ask)。不久前我看到过一个测试结果,对于短句(5个以内关键词),Y/M的相关度都约为G的99%,A则明显差一些。对于长查询,由于G在自然语言处理方面的优势,领先优势就更明显一点但也不是致命的。

      无论如何,将Google和Scirus,Bioweb,或是Hotbot比意义是不大的。

      2.关于PageRank

      PageRank是决定相关度的重要因素之一,但绝不是什么决定性因素。我猜这也是为什么Google让Stanford拥有该专利的原因。PageRank表示一份文档有多重要,但搜索是要找到关键词和文档之间的关系。通常一个搜索引擎使用的相关性模型有数百个输入参数,而PageRank只是其中相当重要的一个而已。

      3.关于百度和Google为什么成功的另外一点理由

      我前面的分析大概有点让人失望。看上去高深无比的PageRank不是Google成功的秘诀。不过,一个公司的成功,本来就不是象神话故事那么简单。一个搜索引擎,从网页搜集,PageRank计算,自然语言处理,逆向索引,相关模型训练,人工修正......,每一件事情就已经非常具有挑战性,更何况这些项目都要同时进行。基本上,如果我是谢尔盖或是拉瑞的话,Google就已经完了。

      4.运气运气运气

      这么多人做,总会有一个成功者。有时候,我们在分析为什么G/B会成功时,也许不是在为结果找一个原因,而是在为一个原因找一个结果吧。

      • 家园 说得非常好。

        送花。

        无论如何,将Google和Scirus,Bioweb,或是Hotbot比意义是不大的。

        说得非常好。之所以没有拿Google和Yahoo,MSN,Ask比较Precison和Recall,主要原因是只找到Google和Scirus,Bioweb和Hotbot,而没有找到Google与Yahoo,MSN和Ask的比较。所以就偷懒了一下。结果被无逻辑兄逮了一个正着。:)

        PageRank是决定相关度的重要因素之一,但绝不是什么决定性因素。

        这句话说得也对。PageRanking已经不是Google的独门秘诀,而是你有我也有的commodity。Google成功的关键原因,主要是它把系统各个部分都做得很精致。此外,加上一点luck。

        至于为什么百度能够在中国市场赢得胜利,我觉得人工因素不可忽视,甚至是关键原因。Googler们可能认为靠人工因素胜出,胜之不武,没有太多技术含量。但是从用户角度出发,用户是不在乎技术含量多寡,他们重视的是用户体验。只要用户体验好,大量引入人工因素,有何不可?

    • 家园 百度的百科问答很有用

      确实,如果只从技术层面分析就没意思了。我在国内,google用了很多年了,转百度真是有个过程,但是这两年已经开始越来越多的以百度为主了,因为查中文信息还是百度更方便,更多.

      如果以技术层面,那当然是google功能强大,我15分钟前发的帖子,竟然在google上就能查出来.但是就用处而言,大家用搜索不是图这个的,几年前,搜索主要是查资料,现在却更多是日常生活,比如车站、地名、人物志、时刻表。这些东西变动都不大,但是很琐碎。在百度上,查完之后首先就会进入百度知道或百度百科,这个真的是很方便。

      百度和google在中国的此消彼长,其实就是网络由精英走向大众的过程,这个与QQ与MSN有些象。一开始用QQ,然后有了MSN,因为大家都说MSN是精英用的,所以大家全都注册MSN,然后MSN是工作,QQ是闲聊,但是到了最后,反而更多是用QQ,虽然好象功能全都差不多,但是就是觉得QQ习惯。

      总觉得这个是不是和中国文化有关系。若是只比技术谁强大,那肯定是google,其实google的功能一点都不少,比如google earth,但是用时也就图个新鲜,大家看见都叹为观止,但用时间长了,却觉得信息不足,现在查地图还是宁愿用go2map。

      百度实际上做了很多与日常生活相关的东西,促进了平民化的使用,比如贴吧、MP3、知道、百科等,而且百度搜索对于百度知道、百度百科等栏目都有推介作用,这样就形成了一个合力。

      • 家园 搜了我的家乡名字,觉得百度百科很好

        GOOGLE和BAIDU搜索结果差不多。

        都有搜索到百度百科,那个词条也写得很有用,

        全面介绍了我的家乡的经济,地理,文化,旅游等等。

        如果没有好的CONTENT,搜索ENGINE再POWERFUL有什么用呢。

        我觉得百度开发类似于WIKIPEDIA的功能很好呀。

      • 家园 花,顺便多说几句

        这个要花。

        百度最吸引人的除了中文搜索功能比google强大之外,还有百度百科是wiki被封之后的最佳替代品,百度贴吧相当于小bbs,百度知道能解决不少生活中的问题,还有百度mp3就不用说了。

      • 家园 同意啊

        我也是由goole转百度的,究其原因却是百度那很简陋的贴吧。

        相信经过05超级女声的人多少都在百度“声名狼藉”的贴吧中花费过不少的时间,在这段时间时间中,使用习惯就慢慢转换了

        恭喜:你意外获得【通宝】一枚

        鲜花已经成功送出。

        此次送花为【有效送花赞扬,涨乐善、声望】

      • 家园 百度找个国内的资源不是一般比google好用。

        两者的差距就跟google跟百度这两个公司的差距一样~

分页树展主题 · 全看首页 上页
/ 12
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河