Spidr 介绍
Spidr 是一个Ruby 的网页爬虫库,可以将整个网站、多个网站、某个链接完全抓取到本地。
安装方法:sudo gem install spidr
代码示例:
Spidr.start_at('http://tenderlovemaking.com/')
Spidr.site('http://rubyinside.org/') do |spider|
spider.every_url { |url| puts url }
end
Spidr 官网
http://spidr.rubyforge.org/