购买了旗舰版。飞掠模式不成功啊,只给点击一次。
举报 使用道具
| 回复

共 13 个关于本帖的回复 最后回复于 2019-4-15 10:57

沙发
henry2144 中级会员 发表于 2019-4-12 16:23:21 | 只看该作者
http://std.sacinfo.org.cn/gnoc/q ... 7CECC4F20A517AFABE7
这个弹窗是不是用飞掠模式?
举报 使用道具
板凳
wangyong 版主 发表于 2019-4-12 16:26:04 | 只看该作者
henry2144 发表于 2019-4-12 16:23
http://std.sacinfo.org.cn/gnoc/queryInfo?id=A6047B87533CE7CECC4F20A517AFABE7
这个弹窗是不是用飞掠模 ...

不点阅读全文的话,不需要用飞掠模式
只点一次的原因是xpath写的不正确,可以把规则名发出来,看看是什么问题
举报 使用道具
地板
Fuller 管理员 发表于 2019-4-12 16:26:49 | 只看该作者
henry2144 发表于 2019-4-12 16:23
http://std.sacinfo.org.cn/gnoc/queryInfo?id=A6047B87533CE7CECC4F20A517AFABE7
这个弹窗是不是用飞掠模 ...



这个不是弹窗,这是一个浮动窗体,而弹窗口是指一个完整的有标题条的窗口。点击不到其他的,可能原因:
1,要把当前显示出来的浮窗先关了,不然阻挡了下面的点击位置
2,写的xpath不对,点击用的xpath能覆盖到所有这些点击位置。

你的规则的主题名是什么?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
Fuller 管理员 发表于 2019-4-12 16:28:01 | 只看该作者
我试了一下,点击 阅读全文,就要用飞掠了
举报 使用道具
6#
henry2144 中级会员 发表于 2019-4-12 16:28:44 | 只看该作者
主题名是“国家标准公告信息抓取”
举报 使用道具
7#
Fuller 管理员 发表于 2019-4-12 17:11:47 | 只看该作者
henry2144 发表于 2019-4-12 16:28
主题名是“国家标准公告信息抓取”


这一级不要勾 飞掠模式

你的点击定位xpath是
  1. //*[@id='gblist']/table[position()=1]/tbody/tr[position()=1]/td[position()=3]/a
复制代码
用如图的方法去搜,只能搜到一条。而是应该改成
  1. //*[@id='gblist']/table[position()=1]/tbody/tr/td[position()=3]/a
复制代码
就能搜到21条了。就是把那个tr的限定删了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
8#
henry2144 中级会员 发表于 2019-4-15 09:39:24 | 只看该作者
谢谢。可以连续点击多条了,但是现在又出现了新的问题就是,遇到文字较多,变成两行文字或多行文字的单元格就跳过不点击了。这个该怎么办?
举报 使用道具
9#
henry2144 中级会员 发表于 2019-4-15 09:40:13 | 只看该作者
比如楼上图的第4行第5行。
举报 使用道具
10#
henry2144 中级会员 发表于 2019-4-15 09:53:18 | 只看该作者
还有的问题就是对于每一个线索,它在网页里每次点击这些单元格的链接后形成的每个XML文件都重复上上次点击形成的XML文件中的记录,这个怎么改成,每次点击的XML文件只包含本次点击采集的信息。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-5 17:31