我有以下(PHP)代码遍历整个DOM文档以获取所有文本节点.这是一个丑陋的解决方案,我相信一定有更好的方法……所以,有吗?
$skip = false; $node = $document; $nodes = array(); while ($node) { if ($node->nodeType == 3) { $nodes[] = $node; } if (!$skip && $node->firstChild) { $node = $node->firstChild; } elseif ($node->nextSibling) { $node = $node->nextSibling; $skip = false; } else { $node = $node->parentNode; $skip = true; } }
谢谢.
解决方法
你需要的XPath表达式是// text().尝试使用
DOMXPath::query
.例如:
$xpath = new DOMXPath($doc); $textnodes = $xpath->query('//text()');