|
ym给出的自定义XPath应该这样理解:
1,定位标志表达式,是
表示任何一个节点。所以,这个定位表达式就是永远有效了。这个定位标志表达式是抓取规则加载到工作台上的时候使用的。如果所有抓取内容都这样定义规则,就不可能加载失败了。
如果网页上的内容有时候有有时候没有,这样写定位标志表达式就总是有效
2,抓取内容表达式:由DS打数机使用,而不是由MS谋数台使用,所以,这个表达式决定了是否能抓到内容,而不管是否能把规则加载到工作台上。
ym这种写法是一种很巧妙的用法,做出来的规则无论什么时候都能加载到工作台上,但是,如果你把大部分抓取内容都这样处理,等下次加载规则的时候,你会发现抓取内容定位到的节点会很怪
|
|