11#
Fuller 管理员 发表于 2020-9-1 10:16:24 | 只看该作者
xiaogang184211 发表于 2020-9-1 09:59
最后一级翻页还需要指向点击规则吗,如果要,不就是只要执行分公司2这个点击任务,其他都不需要改吗
...

规则1:点击返回按钮 -》 规则2:点击证券公司 -》 规则3: 点击 分公司tab -》 规则4:翻页采集分公司

应该是这样的,不过要实验一下
举报 使用道具
12#
xiaogang184211 初级会员 发表于 2020-9-1 10:42:16 | 只看该作者
Fuller 发表于 2020-9-1 10:16
规则1:点击返回按钮 -》 规则2:点击证券公司 -》 规则3: 点击 分公司tab -》 规则4:翻页采集分公司

...

规则4翻页采集分公司,没有指向的话,就不会在循环采集证券公司基本信息3里面的其他公司了
举报 使用道具
13#
shenzhenuser1 版主 发表于 2020-9-1 15:54:45 | 只看该作者

1,第一级规则不做点击和回退,直接通过抓取@onclick,就可以通过Excel构造下级页面的网址,实现层级抓取
https://jg.sac.net.cn/pages/publicity/indicatorsFrame.html?aoi_id=5971&is_org_search=no

2,第二级规则点击“分公司”按钮调整到第三级

3,在第三级页面上进行翻页,由于是层级抓取也就不需要设置返回到第一级了


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
14#
Fuller 管理员 发表于 2020-9-1 15:55:19 | 只看该作者
xiaogang184211 发表于 2020-9-1 10:42
规则4翻页采集分公司,没有指向的话,就不会在循环采集证券公司基本信息3里面的其他公司了
...

应该不会,这个网站我们曾经采集过,不过不是我做的规则
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • LDA主题分析模型到底是什么?
  • top2vec话题发现原理和使用方法
  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别

热门用户

GMT+8, 2026-4-9 03:16