C# 和 Xpath - 在单个 Xpath 查询中使用节点集和字符串类型返回结果

问题描述

在项目中,我使用 Xpath 来抓取价格。在这种情况下,我可以有 2 个选项来获取一个查询指定的价格:

var xpath = @"substring-after(//div[@class='price'],":")|//span[@class="oldPrice"]";

在 C# 代码中:

            HtmlDocument htmlDocument = new HtmlDocument();
                htmlDocument.LoadHtml(html);
            XPathNavigator navigator = document.DocumentNode.CreateNavigator();
            var eval = navigator.Evaluate(xpath); // here i get error: Expression must evaluate to a node-set.
            var expression = navigator.Compile(xpath); // and also here i get error: Expression must evaluate to a node-set.

我知道 substring-after(//div[@class='price'],":") 是字符串的返回类型。 并且 //span[@class="oldPrice"] 是 Node-Set 的返回类型

你有什么建议我应该如何处理这个案子?
a) 我是否应该拆分 xpath 并解析由“|”分隔的每个部分?
b) 或者有没有其他方法可以使用上面的组合 xpath 查询获得结果而不拆分字符串和检查每个部分?
c) 我是否错过了任何其他符合我要求的课程?

我希望有足够的上下文。

解决方法

联合运算符仅适用于节点集,因此您的表达式应该会失败,因为 LHS 是一个字符串(即使 //div 不选择任何内容,它也是一个字符串)。

您是否希望 //span[@class="oldPrice"] 返回单个节点?在这种情况下,您可以使用 string() 函数将其转换为字符串,然后使用 concat() 函数连接两个字符串。

考虑迁移到更高版本的 XPath,它允许您返回字符串序列。