五千年(敝帚自珍)

主题:【求助】求能自动抓取网站内容的软件 -- 渡泸

共:💬29 🌺40
全看分页树展 · 主题 跟帖
家园 一些说明

这个需要一点儿ruby脚本的知识,如果你有兴趣的话就好办了。

环境的准备包括:

1.安装ruby186-26

http://rubyforge.org/frs/download.php/29263/ruby186-26.exe

2.安装rubygems 1.3.7

http://rubyforge.org/frs/download.php/70697/rubygems-1.3.7.zip

打开命令行,进入rubygems解压后的目录,运行ruby setup.rb.

3.安装firewatir

打开命令行,运行gem install watir

4.安装Firefox插件jssh

http://wiki.openqa.org/download/attachments/13893658/jssh-3.6-WINNT.xpi

环境准备好后可以写一些很简单的Ruby脚本来模拟网站交互以及抓取信息。

具体可以查看http://watir.com网站的相关文档。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河