goodhanbin 中级会员 发表于 2019-12-13 15:55:34 | 显示全部楼层
Fuller 发表于 2019-12-13 15:50
因为要定义多级采集,我们又没有这个网站的账号,不好测试。
第一级规则定义了翻页采集了吗?

第一级规则,有做自定义翻页
举报 使用道具
goodhanbin 中级会员 发表于 2019-12-13 16:04:49 | 显示全部楼层
Fuller 发表于 2019-12-13 15:50
因为要定义多级采集,我们又没有这个网站的账号,不好测试。
第一级规则定义了翻页采集了吗?

第一级规则,有自定义翻页
举报 使用道具
Fuller 管理员 发表于 2019-12-13 16:26:43 | 显示全部楼层
goodhanbin 发表于 2019-12-13 16:04
第一级规则,有自定义翻页

转到这个帖子进行讨论吧:https://www.gooseeker.com/doc/thread-15838-1-1.html
举报 使用道具
goodhanbin 中级会员 发表于 2019-12-17 12:38:42 | 显示全部楼层
Fuller 发表于 2018-7-18 10:26
工作台上看到的是自动生成的规则,看不到手工修改的

我的问题,和他楼主反馈一样,二级规则,还是无法自动翻页
举报 使用道具
goodhanbin 中级会员 发表于 2019-12-17 12:39:05 | 显示全部楼层
Fuller 发表于 2018-7-18 10:26
工作台上看到的是自动生成的规则,看不到手工修改的

我的问题,和他楼主反馈一样,二级规则,还是无法自动翻页
举报 使用道具
goodhanbin 中级会员 发表于 2019-12-18 17:55:42 | 显示全部楼层
maohui 发表于 2018-7-17 23:11
关于翻页问题,从你的截图看,一级和二级的翻页的样式一模一样。在爬虫路线工作台上,点击“查看规则”按钮 ...

二级界面窗口,连续翻页,解决了,

但是,二级界面窗口,第一行的所有页面采完之后,返回一级规则界面时,直接跳到第4行采集了,中间的2-3行未采;

同时,一级规则第一页采完之后,打数机便停止了,未做翻页

不翻页

不翻页

跳行

跳行
举报 使用道具
goodhanbin 中级会员 发表于 2019-12-19 08:26:45 | 显示全部楼层
Fuller 发表于 2019-4-15 16:39
没错啊,就是两级规则:
第一级规则:点击浏览次数,弹出一个窗口,交给第二个规则去采集
第二级规则:采 ...

  第二次规则,增加一个动作:点x关闭窗口,主题名:第一级规则,这样二级规则就不会翻页了
举报 使用道具
Fuller 管理员 发表于 2019-12-19 09:27:27 | 显示全部楼层
goodhanbin 发表于 2019-12-19 08:26
第二次规则,增加一个动作:点x关闭窗口,主题名:第一级规则,这样二级规则就不会翻页了
...

在这个新问题上讨论吧,按照我说的,先做一个点击用于清理网页上的窗口,再用第二个点击把新窗口点出来:https://www.gooseeker.com/doc/thread-15845-1-1.html
举报 使用道具
goodhanbin 中级会员 发表于 2020-6-8 16:53:29 | 显示全部楼层
Fuller 发表于 2018-7-18 10:26
工作台上看到的是自动生成的规则,看不到手工修改的

楼主,也能做出来,但是为何我这边不行呢?盼指教,甚为感谢!

第二级规则,随着一级规则翻页之后,第二级规则不执行了,只采集第一级规则的第一页数据,
举报 使用道具
Fuller 管理员 发表于 2020-6-8 16:56:43 | 显示全部楼层
goodhanbin 发表于 2020-6-8 16:53
楼主,也能做出来,但是为何我这边不行呢?盼指教,甚为感谢!

第二级规则,随着一级规则翻页之后,第二 ...

这个帖子是好早以前的了,网站一定会改版的。爬这个数据有很大难度,因为要连续做好几级规则。中间某一级有问题,就会影响后面的。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 09:47