问题描述
|
我一直在为某个特定问题制作xml模板,以搜寻该问题的工作。我正在使用xpath制作模板,但是在可运行的时间,搜寻器正在运行,没有给出错误但没有列出作业
例如:Sopra技术的模板(编码中提供的url)
<?xml version=\"1.0\" encoding=\"UTF-8\"?>
<site>
<request-type>link</request-type>
<base-url><![CDATA[http://www.in.sopragroup.com/index.htm]]></base-url>
<start-url><![CDATA[http://www.in.sopragroup.com/careers/JobListing.aspx]]>
</start-url>
<data>
<intermediate>
<navigation-request>
<navigation-type>link</navigation-type>
<url>
<xpath></xpath>
<sub-xpath></sub-xpath>
</url>
</navigation-request>
<xpath><![CDATA[//table[@class=\'bg_lgrey\']/tbody/tr[position>2]]></xpath>
<apply-url>
<sub-xpath><![CDATA[td/@href]]></sub-xpath>
</apply-url>
<title>
<sub-xpath><![CDATA[td/a/text()]]></sub-xpath>
</title>
</intermediate>
<detail>
<xpath><![CDATA[//table[@id=\'tbl\']/tbody]]></xpath>
<experience>
<sub-xpath><![CDATA[tr[8]/td[2]/text()]]></sub-xpath>
</experience>
<location>
<sub-xpath><![CDATA[tr[10]/td[2]/text()]]></sub-xpath>
</location>
<description>
<sub-xpath><![CDATA[tr[2]/td[2]/text()]]></sub-xpath>
</description>
</detail>
</data>
</site>
解决方法
//table[@class=\'bg_lgrey\']/tbody/tr[position>2]
这是代码中的问题之一。仅当tr
元素具有名为position
的子代时,这样的Xpath表达式才有机会选择某些内容,该子代的字符串值可转换为值大于2的数字。
你要:
//table[@class=\'bg_lgrey\']/tbody/tr[position() >2]
第二个问题:
在两个URL指向的页面的源中根本没有字符串“ 5”。