爬取指定页面链连

下面是编程之家 jb51.cc 通过网络收集整理的代码片段。

编程之家小编现在分享给大家,也给大家做个参考。

require 'rubygems'
require 'open-uri'


url_hash = {}

open('http://www.cnblogs.com/TomXu/archive/2011/12/15/2288411.html').each do |i|
  if i =~ /(http:\/\/www.cnblogs.com\/TomXu\/archive.*\.html).*(.*">.*<\/a)/
    url_hash[$1] = $2[2..-4]
  end
end

url_hash.each do |k,v|
  # puts k 
  # puts v
  # puts "**********************"
  `wget #{k} -O #{v}.html`
end

以上是编程之家(jb51.cc)为你收集整理的全部代码内容,希望文章能够帮你解决所遇到的程序开发问题。

如果觉得编程之家网站内容还不错,欢迎将编程之家网站推荐给程序员好友。

相关文章

validates:conclusion,:presence=>true,:inclusion=>{...
一、redis集群搭建redis3.0以前,提供了Sentinel工具来监控各...
分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣...
上一篇博文 ruby传参之引用类型 里边定义了一个方法名 mo...
一编程与编程语言 什么是编程语言? 能够被计算机所识别的表...
Ruby类和对象Ruby是一种完美的面向对象编程语言。面向对象编...