主题：【原创】Facebook的一小步（上） -- forsake

共:💬57 🌺187

信息技术

【原创】如果是偶尔看看某个网站的动态HTML,可以

用Chrome右键的"Inspect element"或者Firefox "Dom Inspector"(一个Addon).对西西河这样的网站使用这些工具时有个小技巧，不要尝试直接获取整个网页或者BODY的HTML。在"Inspect element"中沿着DOM TREE往下走，然后右键选择“Copy as HTML"或者“Copy XML"就可以了。

如果想要通过程序自动获取有以下路径：

1.熟悉JAVA SCRIPT的可以考虑写Chrome的Extension.

2.熟悉C++的可以考虑调用IE的WEB控件，如果对IE和ActiveX COM熟悉的话两天就够了。缺点是这个东西不能做为服务在后台运行。

3.直接修改Chromium,熟悉的3--5天.这个方案的好处是可以做为后台服务。

全看分页树展 · 主题跟帖

相关回复上下关系8
压缩 2 层
- - 🙂我估计google的爬虫已经具有了类似浏览器对HTML和 1 当年万户侯字70 2011-03-04 02:02:20
  - 🙂看不见就是不存在？素里太守字0 2011-03-03 18:15:35
    🙂能不能给个答案 MacArthur 字26 2011-03-03 19:25:15
    🙂【原创】如果是偶尔看看某个网站的动态HTML,可以
    🙂【原创】可不可以遍历整个DOM？ 1 狡猾的史倍思字312 2011-03-03 21:48:33
- 🙂辩护一下哈 19 forsake 字1856 2011-03-02 14:44:33
  - 🙂百度可能没事，呵呵无力字136 2011-03-02 20:06:22
    🙂咳咳，这么直接不好吧 forsake 字14 2011-03-03 03:10:12

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明