skycaiji 基于 PHP 的数据采集发布爬虫系统

程序名称:skycaiji

授权协议: Apache

操作系统: 跨平台

开发语言: PHP

skycaiji 介绍

蓝天采集器(skycaiji)是一款免费的数据采集发布爬虫软件,采用PHP+MysqL开发,可部署在云服务器,几乎能采集所有类型的网页,无缝对接各类CMS建站程序,免登录实时发布数据,全自动无需人工干预!是大数据、云时代网站数据自动化采集的最佳云端爬虫软件。

  • 支持 PHP5.4~PHP7

  • 支持多级、多页、分页抓取

  • 支持正则、xpath、json 匹配内容

  • 可将数据导入 cms 系统或自己开发的程序、直接入库、保存为文件

  • 实现定时定量全自动采集发布

  • 图片本地化,可自定义图片下载目录

  • 代理ip防屏蔽、将内容翻译成各类语言

  • 可循环入库同页面格式一致的数据列表

  • 可以配合谷歌浏览器实现网页渲染自动加载ajax内容

  • 界面自适应宽度,手机也可以操作采集

skycaiji 官网

http://www.skycaiji.com

相关编程语言

Pacman 是一个软件包管理器, 作为 ArchLinux 发行版...
Smb4K 是KDE下的网络共享浏览器 更多屏幕截图请看:...
Wine (“Wine Is Not an Emulator” 的首字母缩写)...
虚拟桌面软件,可管理最多9个虚拟桌面,你可以用热键...
UNetbootin (Universal Netboot Installer)为一种跨...
Cobbler 可以用来快速建立 Linux 网络安装环境,它已...