主题:【原创】Facebook的一小步(上) -- forsake
1.FC搞的这个东西一点也不新鲜,最基本的思路叫JavaScript injection。injection可以是动态,也可以是静态,FC搞的是静态,类似的还有Twitter。现在的网站上有FC和Twitter敲边鼓的可真不少,比如TECHCRUNCH。动态injection的有GetGlue。FC不过用自己的强势地位与其他网站搞双赢游戏,创新的意义是完全没有的。
2.
难吗?不难,起码对GOOGLE一点都不难!
我将楼主的这段话输入GOOGLE,第一项搜索结果立马指向西西河。别忘了,西西河可是Javascript动态生成的“坏典型”。
俺现在有足够的理由相信,GOOGLE并不是将静态网页的内容直接分析,而是将网页的URL放入一个“浏览器”(服务器上运行的浏览器实例),然后将“浏览器”中网页的DOM TREE的HTML内容传给其它服务器分析。
注意GOOGLE的搜索结果,在它的右边有一放大镜图标,点击之,GOOGLE将显示结果网页的快照图像,如果网页没有经过“浏览器”加载,这快照图像从何而来?!
3.google采集的绝大部分数据都没有经过网站主人的“允许”。不信你问问老铁,他当初建完西西河后给GOOGLE发过请帖邀请GOOGLE来搜索吗?搜索引擎搜索数据属于不请自到,网站不自动拒绝的话它下次一定还来。对大部分中小网站的站主而言,接纳FC的同时一定要拒绝google吗?如果是的话,对大部分中小网站的站主必须回答这样一个问题:FC与google那个是更好的网站推广渠道?这答案不是很明显吗!
对广大的海外中文网站,这显然是一个不是问题的问题。FC与Twitter依然被天朝的伟大GFW阻挡在外,如果你的网站没有活腻歪的话,还是少和FC与Twitter眉来眼去。
- 相关回复 上下关系8
🙂【原创】楼主孟浪了,文中的很多论据经不起推敲。。。
🙂关于西西河的部分,太守说的不完全对。不过我也不能多说 铁手 字0 2011-03-04 10:32:21
🙂del forsake 字1 2011-03-04 13:00:59
🙂动态Injection怎么抓内容呢? MacArthur 字68 2011-03-03 17:23:05
🙂就我所知,Google目前只能抓一部分符合规定的Ajax 1 forsake 字393 2011-03-04 03:50:05