问题描述
要开始使用Selenium的 Python 客户端,您应该避免解决/绕过googlecaptcha的问题。
Selenium
Selenium使浏览器自动化。现在,您要使用这种功能实现的一切完全取决于个人,但主要是为了通过浏览器客户端自动化Web应用程序以进行测试,并且粗略地讲,它当然不限于此。
验证码
另一方面,验证码(Captcha)(首字母缩写是……完全自动化的公共Turing测试,以告诉计算机和人类分开…… )是一种挑战-响应测试,用于计算以确定用户是否为人类。
因此, Selenium 和 Captcha 具有两个完全不同的目的,并且理想情况下不应用于完成任何相互关联的任务。
话虽如此,recaptcha可以轻松地检测网络流量并将您的程序标识为 Selenium 驱动的 。
通用解决方案
但是,有一些通用方法可以避免在网络抓取时被检测到:
- 网站可以通过您的 来确定您的脚本/程序的首要属性。因此,建议 使用常规的视口。
- 如果您需要向网站发送多个请求,请继续对每个请求更改 。在这里,您可以找到有关在Selenium中更改Google Chrome用户代理的方式的详细讨论?
- 为了模拟 人类一样 的行为,你可能需要甚至超越脚本执行减慢WebDriverWait和expected_conditions诱导
time.sleep(secs)
。在这里您可以找到有关[如何在python中hibernateWebdriver毫秒的详细讨论
解决方法
我想知道如何使用Selenium和python绕过Google验证码
当我尝试取消Google提供给我的验证码的内容时,是否可以使用Selenium python绕过Google验证码。
例如,它是google
recaptha,您可以通过以下链接查看此验证码:https :
//www.google.com/recaptcha/api2/demo