在python上访问带有基本身份验证的网页

我正在尝试使用机械化连接网页,但我收到了http 401错误.

这是我的代码;

import base64,mechanize

url = "http://www.dogus.edu.tr/dusor/FrmMain.aspx"
user = "user"
pwd = "pwd"

br = mechanize.browser()
br.set_handle_robots(False)
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(),max_time=1)
br.addheaders = [('User-agent','Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]

br.add_password(url,user,pwd)
#br.addheaders.append(('Authorization','Basic %s' % base64.encodestring('%s:%s' % (user,pwd))))
print br.open(url).read()

add_password和addheaders都不起作用.是因为我从未指定过领域吗?我怎样才能获得该网页使用的领域?我正在使用的用户名和密码是正确的,因为我可以使用带有这些凭据的chrome登录.

解决方法

您用作示例页面站点需要 NTLM身份验证.您可以通过查看返回的HEADER字段来查看此信息.例如curl -I http://www.dogus.edu.tr/dusor/FrmMain.aspx返回:
HTTP/1.1 401 Unauthorized
Content-Length: 1293
Content-Type: text/html
Server: Microsoft-IIS/7.0
WWW-Authenticate: Negotiate
WWW-Authenticate: NTLM
X-Powered-By: ASP.NET
Date: Mon,07 Apr 2014 21:24:09 GMT

行WWW-Authenticate:NTLM说,使用哪种身份验证方法.我认为这个问题Use python mechanize to log into pages with NTLM authentication的答案对你有帮助.

相关文章

我最近重新拾起了计算机视觉,借助Python的opencv还有face_r...
说到Pooling,相信学习过CNN的朋友们都不会感到陌生。Poolin...
记得大一学Python的时候,有一个题目是判断一个数是否是复数...
文章目录 3 直方图Histogramplot1. 基本直方图的绘制 Basic ...
文章目录 5 小提琴图Violinplot1. 基础小提琴图绘制 Basic v...
文章目录 4 核密度图Densityplot1. 基础核密度图绘制 Basic ...