爬取指定页面链连

下面是编程之家 jb51.cc 通过网络收集整理的代码片段。

编程之家小编现在分享给大家，也给大家做个参考。

require 'rubygems'
require 'open-uri'


url_hash = {}

open('http://www.cnblogs.com/TomXu/archive/2011/12/15/2288411.html').each do |i|
  if i =~ /(http:\/\/www.cnblogs.com\/TomXu\/archive.*\.html).*(.*">.*<\/a)/
    url_hash[$1] = $2[2..-4]
  end
end

url_hash.each do |k,v|
  # puts k 
  # puts v
  # puts "**********************"
  `wget #{k} -O #{v}.html`
end

以上是编程之家(jb51.cc)为你收集整理的全部代码内容，希望文章能够帮你解决所遇到的程序开发问题。

如果觉得编程之家网站内容还不错，欢迎将编程之家网站推荐给程序员好友。

爬取指定页面链连

相关文章