引发HTTPErrorreq.full_url，code，msg，hdrs，fp;; HTTPError：禁止

背景：网页搜刮

实际上，我的目标是下载pdf /从pdf中提取内容（给定URL）并将其保存为.pdf文件。我尝试使用请求库-将提取的内容保存在.pdf文件中，但无法通过Acrobat打开保存的文件-不支持的文件类型，文件已损坏或未正确解码。

使用以下网址也获得相同的错误：

查询：为什么会出现此错误？ -HTTPError：禁止，这是什么意思？该如何解决？

导入urllib

代理= { “ http”：“ http://10.98.21.23:8080”， “ https”：“ https://10.98.21.23:8080”， }

url ='https://www.cricbuzz.com/live-cricket-scores/30354/kkr-vs-mi-5th-match-indian-premier-league-2020'

req = urllib.request.Request（URL，标头= hdr） req.set_proxy（代理，'https'）

响应= urllib.request.urlopen（req.get_full_url（））

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）