五千年(敝帚自珍)

主题:【原创】Facebook的一小步(上) -- forsake

共:💬57 🌺187
全看分页树展 · 主题 跟帖
家园 【原创】楼主孟浪了,文中的很多论据经不起推敲。。。

1.FC搞的这个东西一点也不新鲜,最基本的思路叫JavaScript injection。injection可以是动态,也可以是静态,FC搞的是静态,类似的还有Twitter。现在的网站上有FC和Twitter敲边鼓的可真不少,比如TECHCRUNCH。动态injection的有GetGlue。FC不过用自己的强势地位与其他网站搞双赢游戏,创新的意义是完全没有的。

2.

首先,从技术上说,数据采集更困难:新系统是以 Javascript动态形式生成的,比起静态文字搜集起来要难得

难吗?不难,起码对GOOGLE一点都不难!

今天,在这个全球都在等待iPad2发布的关键时刻,更让我感兴趣的反而是如下一则小小新闻

我将楼主的这段话输入GOOGLE,第一项搜索结果立马指向西西河。别忘了,西西河可是Javascript动态生成的“坏典型”。

俺现在有足够的理由相信,GOOGLE并不是将静态网页的内容直接分析,而是将网页的URL放入一个“浏览器”(服务器上运行的浏览器实例),然后将“浏览器”中网页的DOM TREE的HTML内容传给其它服务器分析。

注意GOOGLE的搜索结果,在它的右边有一放大镜图标,点击之,GOOGLE将显示结果网页的快照图像,如果网页没有经过“浏览器”加载,这快照图像从何而来?!

3.google采集的绝大部分数据都没有经过网站主人的“允许”。不信你问问老铁,他当初建完西西河后给GOOGLE发过请帖邀请GOOGLE来搜索吗?搜索引擎搜索数据属于不请自到,网站不自动拒绝的话它下次一定还来。对大部分中小网站的站主而言,接纳FC的同时一定要拒绝google吗?如果是的话,对大部分中小网站的站主必须回答这样一个问题:FC与google那个是更好的网站推广渠道?这答案不是很明显吗!

对广大的海外中文网站,这显然是一个不是问题的问题。FC与Twitter依然被天朝的伟大GFW阻挡在外,如果你的网站没有活腻歪的话,还是少和FC与Twitter眉来眼去。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河