使用 Google Sheets IMPORTXML 功能抓取网站 示例公式:结果:注意:参考:

问题描述

我需要从该网站 LINK 中抓取“Cpn Rate Ann Amt”单元格。

我已经试过了:

=IMPORTXML("https://www.quantumonline.com/search.cfm?tickersymbol=BAC-P&sopt=symbol","/html/body/font/table/tbody/tr/td[2]/p[1]/table[2]/tbody/tr[2]/td[2]/font")

正如我在网上看到的每个教程所建议的那样,但我无法让它工作。也许它只是不起作用,因为该网站有 .cfm 页面

解决方法

我相信你的目标如下。

  • I need to scrape the "Cpn Rate Ann Amt" cell from this website LINK.,您想使用 IMPORTXML 检索 Cpn Rate Ann Amt 的标头值。

在这种情况下,下面的示例公式和 xpath 怎么样?看到网址中的HTML,我以为<tr bgcolor="FFEFB5">的背景色只是表格,这个或许可以作为xpath使用。

示例公式:

=IMPORTXML(A1,"//tr[@bgcolor='FFEFB5']/../tr[2]/td[2]")
  • 单元格“A1”的网址为 https://www.quantumonline.com/search.cfm?tickersymbol=BAC-P&sopt=symbol

结果:

enter image description here

注意:

  • 当你想要Cpn Rate Ann Amt的值时,你也可以使用下面的公式。

      =IMPORTXML(A1,"//tr[@bgcolor='FFEFB5']/th[2]")
    
  • 在此示例公式中,xpath 用于 https://www.quantumonline.com/search.cfm?tickersymbol=BAC-P&sopt=symbol 的 URL。因此,当 URL 更改时,xpath 可能不起作用。所以请注意这一点。

参考: