重拾perl，写了个小爬虫

Perl 2020-08-22

一年没有用perl了，发现都快忘光了……

用perl来获取网页信息是很简单的，用LWP module就可以了。

有些时候，比如在公司里，想要爬网页需要使用代理，perl里可以使用LWP::UserAgent来添加代理

use LWP::UserAgent;
my $ua=LWP::UserAgent->new();
$ua->proxy("http","http://xxx.yyy.com");
$ua->env_proxy;

在获取链接内容的时候

my $result=$ua->get($url);
	unless($result->is_success){
		print LOG ("unable to get ".$url."\n");//输出到日志文件
		next;
	}
	my $content=$result->content;//得到网页内容

多线程我没有做，也许以后会补上吧

相关文章

Perl碎碎念

1. 如何去重 #!/usr/bin/perl use strict; my %hash; while(...

如何用perl将表格中不同列的数据进行拼凑，然后将拼凑后的数据用“|”连接在一起

最近写了一个perl脚本，实现的功能是将表格中其中两列的数据...

基于表的数据字典构造MySQL建表语句

表的数据字典格式如下：如果手动写MySQL建表语句，确认麻烦，...

如何用Perl对Excel的数据进行提取并分析

巡检类工作经常会出具日报，最近在原有日报的基础上又新增了...

如何用Perl截取报文

在实际生产环境中，常常需要从后台日志中截取报文，报文的形...

如何通过关键词匹配统计其出现的频率

最近写的一个perl程序，通过关键词匹配统计其出现的频率，让...