本帖最后由 langjunlan 于 2018-9-21 14:47 编辑

在做规则的时候,碰到一个定位标记映射的问题,想用对列表做定位映射,
找到的class值为jltem恰好是需要抓取的7个商品才有,但是测试的结果如下:
QQ图片20180920151159.png

但是清楚定位标志映射后,再测试就正确了:
QQ图片20180920151209.jpg
不知道这个问题在哪里?
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2018-9-25 14:48

Fuller 管理员 发表于 2018-9-20 15:24:39 | 显示全部楼层
主题名是什么?那个使用了定位标志映射的主题
举报 使用道具
langjunlan 初级会员 发表于 2018-9-21 15:12:12 | 显示全部楼层
QQ图片20180921151049.png
哈哈,已经修改规则解决了,自己的定位做的太好。现在有个新的问题,有7个商品就第三个的商品名空缺
举报 使用道具
Fuller 管理员 发表于 2018-9-21 16:52:54 | 显示全部楼层
可以在网页上观察一下空缺的商品有什么特点,比如,颜色不一样,字体不一样,内容有多有少等。如果有区别,要调整规则,提高适应性。也可以扩大内容映射选择的节点的范围,比如,本来用text()做映射,可以选择包含text()的div节点,只要没有引入不需要的内容,可以适当扩大
举报 使用道具
langjunlan 初级会员 发表于 2018-9-25 14:48:20 | 显示全部楼层
好的,谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-18 14:14