从表中提取带有= importXM的URL

问题描述

尝试从此链接https://www.proz.com/profile/2900获取网址 还有其他网址,但我仅对此感兴趣:

enter image description here

我使用以下内容: = importXML(A1,“(// td [@ class ='sumContent'] / a / @ href)”)

但是,结果是,我得到了以下结果:

enter image description here

如果您能帮助我仅提取有问题的网址,我将不胜感激。

解决方法

问题是您正在使用一个类,但尝试从中获取唯一值。我们需要某种方法来识别“网站”行。这是一种实现方法:

(?P<first>\d+[.,]?\d*)(?:\s*[\-,]\s*)(?P<second>\d+[.,]?\d*)

工作原理

  1. =VLOOKUP("Website",ImportXML(A1,"(//table[@id='standard_full']//tr)"),2,0) 转储感兴趣表中的所有行。
  2. 然后,使用ImportXML查找以“网站”开头的行(VLOOKUP为我们提供精确匹配),并在第二列中返回值。