您好,我正在尝试刮取给我们的xml提要,我使用简单的htmldom来刮它但有些内容有cdata,我该如何删除它?
<date>
<weekday>
<![CDATA[ Friday
]]>
</weekday>
</date>
<?PHP
<?PHP
include('simple_html_dom.PHP');
include ('PHPQuery.PHP');
if (ini_get('allow_url_fopen'))
$xml = file_get_html('http://www.link.com/url.xml'); }
else{ $ch = curl_init('http://www.link.com/url.xml');
curl_setopt ($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$src = curl_exec($ch);
$xml = str_get_html($src, false); }
?>
<?PHP
foreach($xml->find('weekday') as $e)
echo $e->innertext . '<br>';
?>
我相信默认情况下simplehtmldom删除cdata但由于某种原因它不起作用.
请告诉我您是否需要任何有助于解决此问题的信息
非常感谢你的帮助
解决方法:
您可以使用另一个能够将cdata转换为字符串的xml解析器(Demo):
$innerText = '<![CDATA[ Friday
]]>';
$innerText = (string) simplexml_load_string("<x>$innerText</x>"));
# [...]
<?PHP
foreach($xml->find('weekday') as $e)
{
$innerText = $e->innertext;
$innerText = (string) simplexml_load_string("<x>$innerText</x>");
echo $innerText . '<br>';
}
?>