硒报废时如何修复“陈旧元素参考:元素未附加到页面文档”

问题描述

现代英雄们晚上好,希望大家平安无事!

我希望通过此硒脚本实现的目的是加载页面,单击BTC,ETH,XRP图标以过滤结果,然后继续单击“显示更多”按钮,直到达到最大元素数量为止。已加载-> 1138,然后获取这些1138公司的所有hrefs,单击每个并访问各自的页面,然后在访问的每个内部页面上抓取更多数据点

话虽如此,我尝试了许多不同的方法包括仅打印其工作的每个公司的链接,但是,它无法正确地访问/访问提取的href并说(“陈旧元素引用:element is未附加到页面文档中”)。

听说过显式/隐式等待可以帮助解决此问题,但我似乎无法将其与变量链接一起使用,特别是在代码停止向我提供上述错误的地方

感觉问题出在while循环中,以及它如何处理以下事实:我正在循环浏览下一步将要访问的链接列表。无法强调如果有人可以向正确的方向指引我,我将多么感激!

from selenium.webdriver import Chrome
from selenium.webdriver.support.wait import webdriverwait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
import pandas as pd
import time
from selenium.common.exceptions import NoSuchElementException,ElementNotVisibleException

webdriver = '/Users/karimnabil/projects/selenium_js/chromedriver-1'
driver = Chrome(webdriver)

url = 'https://acceptedhere.io/catalog/company/'
driver.get(url)

btc = driver.find_element_by_xpath("//ul[@role='currency-list']/li[1]/a")
btc.click()

eth = driver.find_element_by_xpath("//ul[@role='currency-list']/li[2]/a")
eth.click()

xrp = driver.find_element_by_xpath("//ul[@role='currency-list']/li[5]/a")
xrp.click()

all_categories = driver.find_element_by_xpath("//div[@class='dropdownMenu']/ul/li[1]")
all_categories.click()

time.sleep(1)
maximun_number = 1138

while True:

  show_more = driver.find_element_by_xpath("//div[@class='row search-result']/div[3]/button")
  elements = driver.find_elements_by_xpath("//div[@class='row desktop-results mobile-hide']/div")
  if len(elements) > maximun_number:
        break
  show_more.click()
  time.sleep(1)
  for element in elements:

      links = element.find_elements_by_xpath(".//div/div/div[2]/div/div/div[1]/a")  
      links = [url.get_attribute('href') for url in links]
      time.sleep(0.5)
      for link in links:
          driver.get(link)
          company_title = driver.find_element_by_xpath("//h3").text
          print(company_title)

解决方法

当您浏览页面时,由于您位于不同的页面上,因此变量(例如show_more)中放置的元素变得陈旧或无状态。似乎您需要等待元素加载或可单击。以下是一些示例: