我试图在“网络刮擦”期间拉出一张精确的桌子.
使用cURL将页面拉入$html,这很好.
使用Firebug来获得所需的精确XPATH.
代码如下:
$dom = new DOMDocument($html);
$dom->loadHTML($html);
$xpath = new DOMXpath($dom);
$summary = $xpath->evaluate('/html/body/table[5]/tbody/tr/td[3]/table/tbody/tr[8]/td/table');
echo "Summary Length: " . $summary->length;
执行时,$summary-> length始终为零.它不会拉那个表节点.
有任何想法吗?
解决方法:
Firefox有可能将“虚拟”tbody元素插入到没有它们的表中;这些元素存在于原始文件中吗?