爬的是悟空问答上关于回答的一些数据,问题是爬完了,导出结果后发现少了很多条问答的数据,规则是自己写的,能导出的数据都没有出错。不知道是哪里出现了问题,就是漏爬、爬不全。大神们麻烦帮忙看一下


举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-1-18 16:09

沙发
wangqicheng 新手上路 发表于 2018-1-18 16:00:21 | 只看该作者
规则名是用车贴士流量2
举报 使用道具
板凳
数据集二期 中级会员 发表于 2018-1-18 16:09:01 | 只看该作者
加载你的规则,映射的内容全部失败了,样例复制也没有做,是把规则改了吗?
1,重新做一下内容映射,重新做一下内容映射,再给抓取的内容加上定位映射
2,这个网页是无限瀑布流网站,随着鼠标滚动会不停的加载更多内容,所以需要使用连续滚屏动作。滚屏动作参考《连续动作:滚屏采集瀑布流网页》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-31 08:50