之前做规则的时候出现过这样的情况,给采集字段做内容映射的时候定位选择偏好class,但是检查规则的时候报错定位不到,有没有办法可以避免出现这种情况?

举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-11-1 12:07

沙发
Fuller 管理员 发表于 2016-11-1 12:07:41 | 只看该作者
在MS谋数台上做规则,然后点击“测试”按钮,此时,可能出现的告警是:
1)抛出异常:一般是因为自定义xpath不符合规范造成的
2)想抓的数据没有抓到:一般是规则不适应造成的

极少可能报错说定位不到,因为在MS谋数台做规则的时候,已经做了内容映射,是拿着实实在在的DOM节点做了映射。如果还出现定位不到,那说明从定位映射到点击“测试”按钮期间,DOM结构变化了,那是因为网页上有javascript代码,会不断运行,修改网页结构。

要避免这种情况,做规则之前先选择菜单 规则-〉冻结页面,然后选择菜单“刷新网页结构”,这些都做了,再开始定义规则。

如果还解决不了你的问题,请把样本页面发出来
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 02:00