:能说下规则加载的错误信息的原因
xpath_error.png



:整理箱顺序为2、7、9、10的抓取内容没有定位到。

* 定位一个节点用xpath,这个表示4个抓取内容的xpath不适合,那么在工作台上,这些抓取内容对应的DOM节点就找不到,处于未映射状态
* 这个提示详细列出了xpath表达式,主要是用于查找原因的
* 其中,9和10,应该比较好查找,因为是相对路径,从J_ReviewsCount那个节点开始找
* 这不是自定义的xpath,自动生成的也是这样
* 2和7就比较难看了,但是,可以猜到你没有用定位标志映射,如果用了的话,也会想9和10,就容易找一个节点
* 为了让抓取规则适应性提高,尽量用上定位标志映射,既映射内容也映射定位标志,那么就会想9和10,xpath会很短,是相对的,就不容易失败
* 4个同时失败,很可能就是2和7导致的


举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2015-9-25 15:45

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 13:54