Ubuntu16.04安装爬虫框架scrapy

scrapy框架需要在Python2.7,lxml,OpenSSL,pip程序或库的基础之上创建。

因此 ,首先,先检查下是否包含上述四个程序或库

kuku@worker1:~$python
Python2.7.12(default,Jul12016,15:12:24)
[GCC5.4.020160609]onlinux2
Type"help","copyright","credits"or"license"formoreinformation.
>>>

可以看到Ubuntu16.04已经预置了python 2.7

接着查看是否还有lxml

>>>importlxml
Traceback(mostrecentcalllast):
File"<stdin>",line1,in<module>
ImportError:Nomodulenamedlxml
>>>
>>>importOpenSSL
>>>

发现没有lxml,有OpenSSL,于是先安装lxml

kuku@worker1:~$sudoapt-getinstallpython-lxml

重新进入

kuku@worker1:~$python
Python2.7.12(default,"credits"or"license"formoreinformation.
>>>importlxml
>>>

没有报错。为保证后续正确安装,需依次执行

kuku@worker1:~$sudoapt-getinstallpython-dev
kuku@worker1:~$sudoapt-getinstalllibevent-dev
kuku@worker1:~$sudoapt-getinstallpython-pip
kuku@worker1:~$sudopipinstall--upgradepip

后执行

kuku@worker1:~$pipinstallScrapy

即可完成Scrapy的安装,查看下scrapy相关命令

kuku@worker1:~$scrapy

wKioL1gsTLaSogffAABQ0GpWPkw832.png-wh_50

然后可以创建一个新的项目

kuku@worker1:~$scrapystartprojectnewproject
NewScrapyproject'newproject',usingtemplatedirectory'/usr/local/lib/python2.7/dist-packages/scrapy/templates/project',createdin:
/home/kuku/newproject

Youcanstartyourfirstspiderwith:
cdnewproject
scrapygenspiderexampleexample.com
kuku@worker1:~$
kuku@worker1:~$sudoaptinstalltree

使用tree看下newproject文件目录

kuku@worker1:~$treenewproject/

wKiom1gsTgDiMWeMAAAglwb_DtI575.png-wh_50

接下来可以根据自己需要对里面文件进行相应的编辑,以满足自己需求。

相关文章

目录前言一、创建Hadoop用户二、更新apt和安装Vim编辑器三、...
原文连接:https://www.cnblogs.com/yasmi/p/5192694.html ...
电脑重启后,打开VirtualBox,发现一直用的虚拟机莫名的消失...
参见:https://blog.csdn.net/weixin_38883338/article/deta...
Ubuntu 18.04 LTS 已切换到 Netplan 来配置网络接口。Netpla...
介绍每个 Web 服务都可以通过特定的 URL 在 Internet 上访问...