规则名:广州数据分析岗_猎聘

一共有100页,抓到84页停止了,显示抓取失败(超时),抓取规则不合适

试了2次都一样在84页。

在线求救~~~~~~~~
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2018-7-26 09:10

沙发
Arie-X 中级会员 发表于 2018-7-25 21:41:23 | 只看该作者
手工翻到84页,可以看到84页的网页结构和前面的有很大不同,当然前面的规则就不适用了。可以一个主题名下建立多个规则,对84页再做一个规则。
举报 使用道具
板凳
kentlost 初级会员 发表于 2018-7-25 23:17:40 | 只看该作者
Arie-X 发表于 2018-7-25 21:41
手工翻到84页,可以看到84页的网页结构和前面的有很大不同,当然前面的规则就不适用了。可以一个主题名下建 ...

做了多个规则,从84页开始第二规则爬。到94页的时候,有两种规则的网页结构,结果又停止了……
举报 使用道具
地板
Fuller 管理员 发表于 2018-7-26 09:10:30 | 只看该作者
kentlost 发表于 2018-7-25 23:17
做了多个规则,从84页开始第二规则爬。到94页的时候,有两种规则的网页结构,结果又停止了…… ...

还可以建立更多的规则,不过,我建议对比一下94页前后的变化,调整规则,让规则的适应性更高。通常,用上定位标志映射是能大幅度提高适应性。参看:https://www.gooseeker.com/doc/article-344-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-14 16:08