如果要使用Python抓取图像,如何在python中选择<div data-image ='.....“”>

问题描述

我正在使用Python从网站上抓取一些图像。 在该网站上,所有图像都使用<div data-image="https://......">进行存储。如何使用Python(Beautiful Soup 4)下载图像?非常感谢!

解决方法

此代码用于下载和保存图像

import os
import urllib
import urllib2
from bs4 import BeautifulSoup

url = "XXX"
html = urllib2.urlopen(url)
soup = BeautifulSoup(html)

imgs = soup.findAll("div",{"class":"thumb-pic"})
 for img in imgs:
     imgUrl = img.a['href'].split("imgurl=")[1]
     urllib.urlretrieve(imgUrl,os.path.basename(imgUrl))
,

您可以使用MediaIoBaseDownload选择具有soup.select('div[data-image]')属性的所有<div>。然后遍历这些div并下载它们(例如,带有请求):

data-image=

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...