在 Python 版剧作家中,如何从框架 (iframe) 中检索元素的句柄?

问题描述

我已经成功地在 python 中使用 Playwright 从页面获取元素。我现在遇到了从嵌入在 iframe 中的文档中获取元素的挑战。例如,我使用了 the w3schools page explaining the <option> element,它将结果显示在 iframe 中。我正在尝试从 iframe 中检索此 <option> 元素的句柄。

使用 page.querySelector()页面获取元素的“正常”方式无法获取 elementHandle,这只会打印 <class 'nonetype'>

with sync_playwright() as p:
    for browser_type in [p.chromium,p.firefox,p.webkit]:
        browser = browser_type.launch(headless=False)
        page = browser.newPage()
        page.goto('https://www.w3schools.com/tags/tryit.asp?filename=tryhtml_option')
        element = page.querySelector('select')
        print(type(element))
        browser.close()

我首先尝试显式获取 iframe 的句柄,但这会产生相同的结果 (<class 'nonetype'>):

with sync_playwright() as p:
    for browser_type in [p.chromium,p.webkit]:
        browser = browser_type.launch(headless=False)
        page = browser.newPage()
        page.goto('https://www.w3schools.com/tags/tryit.asp?filename=tryhtml_option')      
        iframe = page.querySelector('iframe')
        element = iframe.querySelector('select')
        print(type(element))
        browser.close()

如何从 iframe 中获取内容

解决方法

事实证明我很接近,但要正确获取 iframe,我需要调用 contentFrame() 方法。

返回引用 iframe 节点的元素句柄的内容框架,否则返回 null

然后,querySelector() 将返回相应的 elementHandle

with sync_playwright() as p:
    for browser_type in [p.chromium,p.firefox,p.webkit]:
        browser = browser_type.launch(headless=False)
        page = browser.newPage()
        page.goto('https://www.w3schools.com/tags/tryit.asp?filename=tryhtml_option')
        iframe = page.querySelector('iframe').contentFrame()
        element = iframe.querySelector('select')
        print(type(element))
        print(element.innerHTML())
        browser.close()

打印成功

<class 'playwright.sync_api.ElementHandle'>

  <option value="volvo">Volvo</option>
  <option value="saab">Saab</option>
  <option value="opel">Opel</option>
  <option value="audi">Audi</option>

注意:如果有多个 iframe,检索句柄时只需要使用一个属性即可。在上面的例子中通过 id 获取 iframe,例如使用

iframe = page.querySelector('iframe[id=\"iframeResult\"]').contentFrame()
,

querySelector 将返回一个 ElementHandle。在这种情况下,它将是 iFrame 但作为页面元素。如果您想从该元素获取 frame,您需要调用 contentFrame,然后在该框架上工作。

iframe = page.querySelector('#iframeResult').contentFrame()
element = iframe.querySelector('select')
print(type(element))