在scrapy上解决h-captcha

问题描述

我使用 Selenium 进行抓取，每当有验证码时，我都会使用 2captcha 服务来解决验证码问题，如下所示：

from twocaptcha import TwoCaptcha
solver = TwoCaptcha(CAPTCHA_KEY)
captcha = response.xpath("//div[@class='h-captcha' and @data-sitekey]").get()
if captcha:
    url = driver.current_url
    site_key = webdriverwait(driver,5).until(EC.element_to_be_clickable((By.XPATH,"//div[@class='h-captcha']"))).get_attribute("data-sitekey")
    result = solver.hcaptcha(sitekey=site_key,url=url)
    driver.execute_script('document.getElementsByName("h-captcha-response")[0].innerHTML = "{}"'.format(result['code']))
    time.sleep(1)
    driver.find_element_by_xpath("/html/body/form/input").click()

我现在继续使用scrapy，但我一直在努力寻找一种在验证码发生时使用scrapy 2captcha 服务的方法。我确实得到了结果，但不确定如何使用移动一个：

solver = TwoCaptcha(CAPTCHA_KEY)
captcha = response.xpath("//div[@class='h-captcha' and @data-sitekey]").get()
if captcha:
    site_key = response.xpath("//div[@class='h-captcha']/@data-sitekey").get()
    result = self.solver.hcaptcha(sitekey=site_key,url=response.url)
    # AFTER WHAT??

我尝试了类似的东西：

`scrapy.FormRequest.from_response(response,formdata={'h-captcha-response': result['code']},callback=self.parse)`

其中 self.parse 是要抓取的主要函数，但它似乎不起作用。

有什么见解吗？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

2captcha python scrapy