重拾perl,写了个小爬虫

一年没有用perl了,发现都快忘光了……


用perl来获取网页信息是很简单的,用LWP module就可以了。

有些时候,比如在公司里,想要爬网页需要使用代理,perl里可以使用LWP::UserAgent来添加代理

use LWP::UserAgent;
my $ua=LWP::UserAgent->new();
$ua->proxy("http","http://xxx.yyy.com");
$ua->env_proxy;

获取链接内容的时候

my $result=$ua->get($url);
	unless($result->is_success){
		print LOG ("unable to get ".$url."\n");//输出到日志文件
		next;
	}
	my $content=$result->content;//得到网页内容
多线程我没有做,也许以后会补上吧

相关文章

1. 如何去重 #!/usr/bin/perl use strict; my %hash; while(...
最近写了一个perl脚本,实现的功能是将表格中其中两列的数据...
表的数据字典格式如下:如果手动写MySQL建表语句,确认麻烦,...
巡检类工作经常会出具日报,最近在原有日报的基础上又新增了...
在实际生产环境中,常常需要从后台日志中截取报文,报文的形...
最近写的一个perl程序,通过关键词匹配统计其出现的频率,让...