为什么我 的上下级关系不能完全关联,我启动爬虫,但是1级采集的链接不能完全传达到二级线索处  我一级采集了上万条链接 二级线索确只有4条

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2018-1-4 15:03

沙发
yangwenge 金牌会员 发表于 2018-1-4 14:40:35 | 只看该作者
加载位置采集这个规则失败,重新做上内容映射和样例复制,然后修改定位标志为绝对定位测试能正常采集
举报 使用道具
板凳
数据集二期 中级会员 发表于 2018-1-4 14:43:19 | 只看该作者
“链接”链接抓取内容映射错了,加载你的规则就报错了。想要抓取小区链接,需要把@href节点映射给“链接”
点击浏览器中的第一个小区,网页标签窗口会自动定位到A节点,点开A节点attributes,就可以看到@href节点,把这个节点映射给“链接”再做上样例复制和翻页就可以了,做好之后记得点击测试查看一下是否正确。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
qq764553648 初级会员 发表于 2018-1-4 15:03:40 | 只看该作者
数据集二期 发表于 2018-1-4 14:43
“链接”链接抓取内容映射错了,加载你的规则就报错了。想要抓取小区链接,需要把@href节点映射给“链接”
...

我测试是正常的 能够采集到链接 就是传不到下级线索
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-10 05:00