XPath语法要点

什么是XPath

XML Path Language

访问xml中任意位置的一种语法,实际上是一种对于xml文档位置(路径)的描述,与文件系统的路径表达相似
XML是一种层次结构的文档,有一个根元素。构成要素是节点和节点的属性,各个节点之间由嵌套形成parent-child关系

主要层次
/root 根节点
currentNode/child 当前节点的子节点
//someNode 任意一个名为someNode的节点

区分同一节点的不同子节点
节点定位可以通过绝对位置(绝对路径)和相对于其他节点的位置来确定
XML文档的结构属于一种树形结构,因此节点之间的位置关系也可以用树结构中的父子节点、兄弟节点、前驱、后继来描述
轴(axis/axe)用于定义相对于当前节点位置的节点集
轴名称 结果
self 选取当前节点。
parent 选取当前节点的父节点。
ancestor
选取当前节点的所有先辈(父、祖父等)。
ancestor-or-self
选取当前节点的所有先辈(父、祖父等)以及当前节点本身。
descendant
选取当前节点的所有后代元素(子、孙等)。
descendant-or-self
选取当前节点的所有后代元素(子、孙等)以及当前节点本身。
preceding
选取文档中当前节点的开始标签之前的所有节点。
following
选取文档中当前节点的结束标签之后的所有节点。
preceding-sibling
选取当前节点之前的所有同级节点。
following-sibling
选取当前节点之后的所有同级节点。
attribute
选取当前节点的所有属性。
namespace
选取当前节点的所有命名空间节点。

//someNode/following-sibling::* 节点someNode之后的所有同级节点
//someNode/following-sibling::someSib 节点someNode之名为someSib的节点
//someNode/following-sibling::*[2] 节点someNode之后的第2个同级节点
//someNode/following-sibling::*[2]//input 节点someNode之后的第2个同级节点的input子节点

引申--XPath一般位置表示
/step1/step2/... 绝对路径的位置表达
step1/step2/...
绝对路径的位置表达
//step1/step2/... 相
对路径的位置表达
每个step(步)如下表示
轴名称::节点测试[谓语]
其中,轴名称即上述轴位置表达式
节点测试(node-test)指对轴内部节点的识别
谓语是用来查找某个特定的节点(满足某些属性、值要求的节点)的表达式,如/bookstore/book[price>35.00],//title[@lang='eng']


//chapter[normalize-space(@num)="3"]
normalize-space去除字符串头尾的空格

//book/* 所有book节点的子节点
//* 所有的节点
/*/*/*/paragraph 名为paragraph且有3层父节点的节点

//chapter[@*] 所有带有任意属性的chapter节点 (属性个数不小于1)
+
-
*
=
!=
等于和不等于,如果后面比较的对象的一组节点值,那么只有有一个(any)符合条件,即为真。

数值运算
<
>
<=
>=
逻辑运算
and
or
not()

库函数
count() 从0开始计数 //chapter[count(section)=1] 只包括2个section子节点的chapter
name()
starts-with(arg1,arg2) 判断arg1的开始部分等不等于arg2
contains(arg1,arg2) 判断arg1包不包含arg2

其他细节方面的补充参见 http://www.w3school.com.cn/xpath/index.asp

相关文章

php输出xml格式字符串
J2ME Mobile 3D入门教程系列文章之一
XML轻松学习手册
XML入门的常见问题(一)
XML入门的常见问题(三)
XML轻松学习手册(2)XML概念