说一下基本情况,我需要进行条件筛选出列表,然后抓取列表信息。
我的步骤是,建立两级规则,第一级规则专门做连续动作,总共五个动作,最后一个动作是对前四个筛选的条件进行确定,点击“查询”选项。第二级就是抓取规则了。规则保存后,在DS机当中首先单搜第一级规则,报错信息显示:
15:0:13 16/4        4                LoopEnd        在执行后续动作时遇到严重故障,具体请查看日志文件或者联络管理员
15:2:54 16/4        4                LoopEnd        在执行后续动作时遇到严重故障,具体请查看日志文件或者联络管理员
之前也是出现一个错误,显示第五个连续动作有问题。不清楚怎么回事,希望论坛前辈能够帮助解决一下,谢谢了。
举报 使用道具
| 回复

共 18 个关于本帖的回复 最后回复于 2020-4-18 12:09

沙发
Fuller 管理员 发表于 2020-4-16 15:52:06 | 只看该作者
你的规则名字是什么?我帮你看看,根据这个提示,似乎是xpath写的不对
举报 使用道具
板凳
feimahong 新手上路 发表于 2020-4-16 17:03:26 | 只看该作者
Fuller 发表于 2020-4-16 15:52
你的规则名字是什么?我帮你看看,根据这个提示,似乎是xpath写的不对

第一级规则名字是 stage1   
第二级规则名字是 stage2
举报 使用道具
地板
Fuller 管理员 发表于 2020-4-16 17:37:55 | 只看该作者
feimahong 发表于 2020-4-16 17:03
第一级规则名字是 stage1   
第二级规则名字是 stage2

我正在看第一级规则,正在一个个动作做检查,我看到,
第一个动作:点击 出口应诉
第二个动作:点击 发倾销
第三个动作:输入立案起始时间:
第四个动作:输入立案终止时间
第五个动作:点击搜索按钮

目标任务名是 dianji1,起始你并没有定义这个任务,而是期望下一级用这个任务:stage2,那么,在连续动作这里,目标任务名应该填 stage2


另外,在创建规则工作台上,不应该勾下级线索,因为你这个任务的下级任务是有连续动作激发的
举报 使用道具
5#
Fuller 管理员 发表于 2020-4-16 17:44:45 | 只看该作者
第5个动作,你输入的xpath是: /html/body/div[position()=1]/div[position()=2]/form[position()=1]/div[position()=2]/section/section[position()=1]/div[position()=2]/div/input[position()=2]/@class

不应该定位到@class,xpath应该是
/html/body/div[position()=1]/div[position()=2]/form[position()=1]/div[position()=2]/section/section[position()=1]/div[position()=2]/div/input[position()=2]

举报 使用道具
6#
Fuller 管理员 发表于 2020-4-16 17:46:54 | 只看该作者
我测试了,主要问题就是这两个:
1,下级任务名的问题:要在连续动作工作台上写目标任务名,而不应该在创建规则工作台上勾上下级线索
2,第5个点击动作的xpath不对
举报 使用道具
7#
feimahong 新手上路 发表于 2020-4-16 19:05:06 | 只看该作者
Fuller 发表于 2020-4-16 17:46
我测试了,主要问题就是这两个:
1,下级任务名的问题:要在连续动作工作台上写目标任务名,而不应该在创建 ...

按照您的提示,我重新对规则进行了更改,然后在导入stage2文件夹中的一份xml文件作为例子,发现终于成功导出来了。这么一顿操作下来,学到了不少东西。自己在实践过程中也总结了不少经验。实践出真知,古人诚不欺我!
感谢大神的指点,也感谢集搜客的强大功能,真是事半功倍,换做以前,就只能手动一点一点复制粘贴了,现在我可以省出很多的精力和时间做该做的事了!
举报 使用道具
8#
feimahong 新手上路 发表于 2020-4-17 08:58:22 | 只看该作者
Fuller 发表于 2020-4-16 17:46
我测试了,主要问题就是这两个:
1,下级任务名的问题:要在连续动作工作台上写目标任务名,而不应该在创建 ...

大神你好,之前抓取的已经成功了,这次我准备再原有基础上进一步对列表当中的信息进行抓取,这个是不是涉及到层级抓取了?我在之前的stage1的基础上又建立了stage2和stage3规则:stage1就是依旧是连续动作;stage2就是对列表设置链接,stage3就是进入抓取页面进行抓取。但是报错了,还是得麻烦您看一下,哪个步骤有问题?教学视频看过的,但是没有解决。
举报 使用道具
9#
Fuller 管理员 发表于 2020-4-17 09:39:54 | 只看该作者
feimahong 发表于 2020-4-17 08:58
大神你好,之前抓取的已经成功了,这次我准备再原有基础上进一步对列表当中的信息进行抓取,这个是不是涉 ...

第一级:设定搜索条件
第二级:翻页抓取,并为下一级采集网址
第三级:是层级采集的下一级,用来采集详细内容
举报 使用道具
10#
feimahong 新手上路 发表于 2020-4-17 09:50:03 | 只看该作者
Fuller 发表于 2020-4-17 09:39
第一级:设定搜索条件
第二级:翻页抓取,并为下一级采集网址
第三级:是层级采集的下一级,用来采集详细 ...

我上传了一张图片附件,节点跟教学视频的节点不一样,没有发现具体地址,这个是不是只要对attributes进行内容映射。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-4 23:11