爬的是悟空问答上关于回答的一些数据,问题是爬完了,导出结果后发现少了很多条问答的数据,规则是自己写的,能导出的数据都没有出错。不知道是哪里出现了问题,就是漏爬、爬不全。大神们麻烦帮忙看一下


举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-1-18 16:09

沙发
wangqicheng 新手上路 发表于 2018-1-18 16:00:21 | 只看该作者
规则名是用车贴士流量2
举报 使用道具
板凳
数据集二期 中级会员 发表于 2018-1-18 16:09:01 | 只看该作者
加载你的规则,映射的内容全部失败了,样例复制也没有做,是把规则改了吗?
1,重新做一下内容映射,重新做一下内容映射,再给抓取的内容加上定位映射
2,这个网页是无限瀑布流网站,随着鼠标滚动会不停的加载更多内容,所以需要使用连续滚屏动作。滚屏动作参考《连续动作:滚屏采集瀑布流网页》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-12 04:09