GuozhongCrawler 开源爬虫框架

程序名称:GuozhongCrawler

授权协议: EPL

操作系统: 跨平台

开发语言: Java

GuozhongCrawler 介绍

guozhongCrawler的是一个无须配置、便于二次开发的爬虫开源框架,它提供简单灵活的API,只需少量代码即可实现一个爬虫。模块化设计完全
面向业务提供接口,功能覆盖整个爬虫的生命周期(链接提取页面下载、内容抽取、持久化),支持多线程抓取,分布式抓取,并支持自动重试,定制执行js、
自定义cookie等功能。在处理网站抓取多次后被封IP的问题上,guozhongCrawler采用动态轮换IP机制有效防止IP被封。另外,源码中
的注释及Log输出全部采用通俗易懂的中文。让初学者能有更加深刻的理解

GuozhongCrawler 官网

https://git.oschina.net/woshidaniu/GuozhongCrawler

相关编程语言

Pacman 是一个软件包管理器, 作为 ArchLinux 发行版...
Smb4K 是KDE下的网络共享浏览器 更多屏幕截图请看:...
Wine (“Wine Is Not an Emulator” 的首字母缩写)...
虚拟桌面软件,可管理最多9个虚拟桌面,你可以用热键...
UNetbootin (Universal Netboot Installer)为一种跨...
Cobbler 可以用来快速建立 Linux 网络安装环境,它已...