问题描述
尝试从此链接https://www.proz.com/profile/2900获取网址 还有其他网址,但我仅对此感兴趣:
我使用以下内容: = importXML(A1,“(// td [@ class ='sumContent'] / a / @ href)”)
如果您能帮助我仅提取有问题的网址,我将不胜感激。
解决方法
问题是您正在使用一个类,但尝试从中获取唯一值。我们需要某种方法来识别“网站”行。这是一种实现方法:
(?P<first>\d+[.,]?\d*)(?:\s*[\-,]\s*)(?P<second>\d+[.,]?\d*)
工作原理
-
=VLOOKUP("Website",ImportXML(A1,"(//table[@id='standard_full']//tr)"),2,0)
转储感兴趣表中的所有行。 - 然后,使用
ImportXML
查找以“网站”开头的行(VLOOKUP
为我们提供精确匹配),并在第二列中返回值。