主题:广东项目2
地址:   http://www.laho.gov.cn/g4cdata/s ... 40&name=fdcxmxx


循环点击,采集, 麻烦讲述详细一点

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2017-2-10 20:31

沙发
ym 版主 发表于 2017-2-9 15:36:45 | 只看该作者
规则加载失败,这个网址是默认打开首页的,而且有多个页签,不知你要采集的是哪个
你的情况能否具体详细些,实在看不出是啥问题
举报 使用道具
板凳
zhuohui1987 金牌会员 发表于 2017-2-9 17:35:57 | 只看该作者
ym 发表于 2017-2-9 15:36
规则加载失败,这个网址是默认打开首页的,而且有多个页签,不知你要采集的是哪个
你的情况能否具体详细些 ...


麻烦看一下

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
ym 版主 发表于 2017-2-9 18:12:57 | 只看该作者
本帖最后由 ym 于 2017-2-9 18:16 编辑

加载规则失败,爬虫路线那里定位都失败了,整理箱也是空的,不知你要抓什么,麻烦说清楚问题和要做什么,你给个页面,啥都不说,我哪里懂啊。
还有,连续动作是点击销控表,目标主题名是自己本身,这明显有问题,如果你要点到销控表这个页签窗口,由于网址不变,打开的是基本信息的页面,应该是对基本信息的页面做第一个规则,设置这个点击动作,目标主题名填广东项目2,而不是在销控表这个页面设置。
所以,麻烦你弄懂连续动作,再来设置,遇到失败的情况后,把相关主题名+问题+截图发帖说明,我们才能给你分析解决。


连续动作的详细教程http://www.gooseeker.com/tuto/tutorial.html

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
gz51837844 管理员 发表于 2017-2-10 10:42:54 | 只看该作者
在广东项目2的连续动作步骤2里, 你写的xpath是: /html/body/div/form/table[position()=1]/tbody/tr[position()=3]/td/table/tbody/tr[position()=1]/td[position()=1]/input<context>//*[@id='frame']</context>
这个本身只能定位到页面上的一个选项, 所以不可能把其它的也都点一遍
举报 使用道具
6#
gz51837844 管理员 发表于 2017-2-10 10:49:26 | 只看该作者
你之前发的帖子也有类似的问题, 建议你可以这样做:
1. 点击页面上要点击的节点
2. 用MS的"显示xpath", 自动生成该节点的xpath
3. 修改自动生成的xpath, 使它能定位到多个你需要点击的节点. 对于广东项目2步骤2, 你应该把2个position()精确定位给删除, 应该删除部分如下我已标成红色
/html/body/div/form/table[position()=1]/tbody/tr[position()=3]/td/table/tbody/tr[position()=1]/td[position()=1]/input<context>//*[@id='frame']</context>
4. 把修改后的xpath复制粘贴到MS的自动生成xpath的地方, 并且点击"搜索", 看看能搜到几个, 可以点击"下一个"依次查看是否正确
举报 使用道具
7#
zhuohui1987 金牌会员 发表于 2017-2-10 17:58:23 | 只看该作者
主题:广东项目2  

错误提示:抓取规则不适合:没有发现iframe/frame
帮我看一下
举报 使用道具
8#
Fuller 管理员 发表于 2017-2-10 19:09:21 | 只看该作者
zhuohui1987 发表于 2017-2-10 17:58
主题:广东项目2  

错误提示:抓取规则不适合:没有发现iframe/frame

问题1:我加载了你的规则以后,分析失败,在后续分析之前,是不是要先点击哪里,等待内容显示出来才后续分析?

问题2:点击动作的目标主题怎么跟当前主题名一样?这里是不是填错了?

手工模拟了你定义的两个步骤。应该拆分成两个主题
1,主题1:
a)创建规则工作台上的抓取内容应该与初始加载网页后看到的内容对应,不应该是你现在定义的整理箱
b)在连续动作工作台上定义点击动作,xpath就是你现在这个规则的第一个动作,连续动作的目标主题是主题2
2,主题2:
a)创建规则工作台上的整理箱就是你现在定义的整理箱
b)连续动作工作台上的动作就是你现在定义的第二个动作,目标主题还是主题2




举报 使用道具
9#
zhuohui1987 金牌会员 发表于 2017-2-10 20:20:52 | 只看该作者
Fuller 发表于 2017-2-10 19:09
问题1:我加载了你的规则以后,分析失败,在后续分析之前,是不是要先点击哪里,等待内容显示出来才后续 ...

问题1:我加载了你的规则以后,分析失败,在后续分析之前,是不是要先点击哪里,等待内容显示出来才后续分析?
是的,要先点击“销控表”,但是地址不变的,后续分析




1,主题1:
a)创建规则工作台上的抓取内容应该与初始加载网页后看到的内容对应,不应该是你现在定义的整理箱
答:初始加载网页后,我只要点击“销控表”,但是地址不变的,只要点击“销控表”点击后才是我所需要的
怎么可能拆分两个,我试过不行
举报 使用道具
10#
zhuohui1987 金牌会员 发表于 2017-2-10 20:25:57 | 只看该作者
gz51837844 发表于 2017-2-10 10:49
你之前发的帖子也有类似的问题, 建议你可以这样做:
1. 点击页面上要点击的节点
2. 用MS的"显示xpath", 自动 ...

问题1:我加载了你的规则以后,分析失败,在后续分析之前,是不是要先点击哪里,等待内容显示出来才后续分析?
是的,要先点击“销控表”,但是地址不变的,后续分析




1,主题1:
a)创建规则工作台上的抓取内容应该与初始加载网页后看到的内容对应,不应该是你现在定义的整理箱
答:初始加载网页后,我只要点击“销控表”,但是地址不变的,只要点击“销控表”点击后才是我所需要的
怎么可能拆分两个,我试过不行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-3 21:34