求教大神,抓取微博评论区的评论+互动,设立了两级规则,第一级进行连续点击展开,第二级进行抓取。
第一级规则名:于欢案6
第二级规则名:于欢案抓取6
试图抓取的其他网址:http://www.gooseeker.com/doc/for ... ewthread&fid=54

现在的问题是:连第一步点击的连续动作都没有进行就匹配失败了,但是不知道哪里出了问题。
之前发过一个帖子问了一些问题,比如1、每次修改规则都需要重新进行内容映射和样例复制,管理员建议进行定位映射,但是我做了之后,再次修改的话打开还是没有的,不知道问题出在哪里........

求大神指点。




举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-10-9 08:47

沙发
Fuller 管理员 发表于 2017-10-9 08:47:22 | 只看该作者
抓取失败的时候,按照这篇文档分析一下失败的原因,可能是规则的适应性不够。《加载分析失败线索

第一级抓取的内容没有用,所以可以不用做很严格的关键内容校验,找个最容易抓的内容做关键内容
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-10 14:39