使用 XPath 获取 XML 元素的层次结构

问题描述

我试图在我使用 Javascript 中的 DOM 解析器解析的“application/xml” response.data 文档中获取给定元素层次结构的有序列表。因此，表达式应该为每个没有 A 子项的 A 标记返回列表 ['Grand Parent','Parent','Target']。所以我将得到一个列表列表，其中内部列表的最后一个元素将是的最深（就图形深度而言）值。感谢@Jack Fleeting，我知道我可以使用下面的表达式 xpath 获取目标： xpath = '//*[local-name()="A"][not(.//*[local-name()="A"])]/*[local-name()="A-title"]' 但我不确定如何调整它以进入层次结构列表。

<A>
<A-title>Grand Parent</A-title>
   <A>
   <A-title>Parent</A-title>
      <A>
      <A-title>Target</A-title>
      </A>
   </A>
</A>

编辑：

axios.get('WMS_URL').then((r) => {
      const parser = new DOMParser()
      const dom = parser.parseFromString(r.data,'application/xml')
       let xpath = '//*[local-name()="A"][not(.//*[local-name()="A"])]/*[local-name()="A-title"]'
       let xpath2 = 'ancestor-or-self::A/A-title'
       var targets = dom.evaluate(xpath,dom,null,XPathResult.ORDERED_NODE_SNAPSHOT_TYPE,null)
       var targets2 = dom.evaluate(xpath2,targets,null)
       Array.from({ length: targets2.snapshotLength },(_,index) => layerNames.push(targets2.snapshotItem(index).innerHTML))

解决方法

如果您使用 XPath //A[not(A)]/ancestor-or-self::A/A-title，您会得到 //A[not(A)] 所有 A 元素，没有 A 子元素，下一步导航到所有祖先或自身 {{1} } 元素并持续到所有 A 子元素。当然，在带有单个表达式的 XPath 1 中，您无法构造字符串（或元素？）列表的列表，因此您首先需要选择 A-title，然后从那里选择 //A[not(A)] 元素。

使用 XPath 3.1，例如 Saxon JS 2 (https://www.saxonica.com/saxon-js/index.xmlm,https://www.saxonica.com/saxon-js/documentation/index.html)，您可以直接构造一个字符串数组序列，例如

ancestor-or-self::A/A-title

评估 XPath 的 JavaScript 代码将是例如

//A[not(A)] ! array { ancestor-or-self::A/A-title/data() }

对于 DOM Level 3 XPath 1.0，我认为您需要更多的代码行：

let result = SaxonJS.XPath.evaluate('parse-xml($xml)//A[not(A)] ! array { ancestor-or-self::A/A-title/data() }',[],{ params : { 'xml' : r.data }})

dom dom-traversal javascript xml xml xml xml xml xml xml xpath xpath xpath xpath