21#
liao028 中级会员 发表于 2017-1-14 16:13:41 | 只看该作者
我试试
举报 使用道具
22#
liao028 中级会员 发表于 2017-1-14 16:26:51 | 只看该作者
按你说的做了,可测试结果是第10和11页被跳过去了。你试试呢!谢谢!
举报 使用道具
23#
Fuller 管理员 发表于 2017-1-14 16:58:49 | 只看该作者
liao028 发表于 2017-1-14 16:26
按你说的做了,可测试结果是第10和11页被跳过去了。你试试呢!谢谢!

刚才我测试的时候发现了另一个方法:人员列表是有独立网址的,而且可以单独使用,http://jzsc.mohurd.gov.cn/datase ... /001607220057321927 ,那么就可以做层级采集。从iframe的src中把网址采集下来
举报 使用道具
24#
Fuller 管理员 发表于 2017-1-14 17:11:19 | 只看该作者
liao028 发表于 2017-1-14 16:26
按你说的做了,可测试结果是第10和11页被跳过去了。你试试呢!谢谢!

我加载了你的规则,发现xpath没有改成我刚才贴出来的那个,那就是程序有bug,我已经反馈给研发了。你需要在输入xpath以后,把鼠标移到别的地方点击一下,再点击“存规则”。我测试过,我写的那个xpath是可以用的
举报 使用道具
25#
liao028 中级会员 发表于 2017-1-14 18:46:58 | 只看该作者
我是没有存,直接在谋数台上改了,没有点存规则,直接点的“爬数据”。
举报 使用道具
26#
liao028 中级会员 发表于 2017-1-14 18:47:57 | 只看该作者
不行的话,那我试试你说的,层级采集吧。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-4 07:00