主题:【原创】Facebook的一小步(上) -- forsake
共:💬57 🌺187
复 能不能给个答案
用Chrome右键的"Inspect element"或者Firefox "Dom Inspector"(一个Addon).对西西河这样的网站使用这些工具时有个小技巧,不要尝试直接获取整个网页或者BODY的HTML。在"Inspect element"中沿着DOM TREE往下走,然后右键选择“Copy as HTML"或者“Copy XML"就可以了。
如果想要通过程序自动获取有以下路径:
1.熟悉JAVA SCRIPT的可以考虑写Chrome的Extension.
2.熟悉C++的可以考虑调用IE的WEB控件,如果对IE和ActiveX COM熟悉的话两天就够了。缺点是这个东西不能做为服务在后台运行。
3.直接修改Chromium,熟悉的3--5天.这个方案的好处是可以做为后台服务。
- 相关回复 上下关系8
压缩 2 层
🙂我估计google的爬虫已经具有了类似浏览器对HTML和 1 当年万户侯 字70 2011-03-04 02:02:20
🙂看不见就是不存在? 素里太守 字0 2011-03-03 18:15:35
🙂能不能给个答案 MacArthur 字26 2011-03-03 19:25:15
🙂【原创】如果是偶尔看看某个网站的动态HTML,可以
🙂【原创】可不可以遍历整个DOM? 1 狡猾的史倍思 字312 2011-03-03 21:48:33
🙂辩护一下哈 19 forsake 字1856 2011-03-02 14:44:33
🙂百度可能没事,呵呵 无力 字136 2011-03-02 20:06:22
🙂咳咳,这么直接不好吧 forsake 字14 2011-03-03 03:10:12