爬的是悟空问答上关于回答的一些数据,问题是爬完了,导出结果后发现少了很多条问答的数据,规则是自己写的,能导出的数据都没有出错。不知道是哪里出现了问题,就是漏爬、爬不全。大神们麻烦帮忙看一下


举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-1-18 16:09

wangqicheng 新手上路 发表于 2018-1-18 16:00:21 | 显示全部楼层
规则名是用车贴士流量2
举报 使用道具
数据集二期 中级会员 发表于 2018-1-18 16:09:01 | 显示全部楼层
加载你的规则,映射的内容全部失败了,样例复制也没有做,是把规则改了吗?
1,重新做一下内容映射,重新做一下内容映射,再给抓取的内容加上定位映射
2,这个网页是无限瀑布流网站,随着鼠标滚动会不停的加载更多内容,所以需要使用连续滚屏动作。滚屏动作参考《连续动作:滚屏采集瀑布流网页》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 07:55