11#
henry2144 中级会员 发表于 2019-4-15 10:16:25 | 只看该作者
点击后增加延时?重复采集的原因是没有点击关闭小窗?但是点击关闭小窗后的主题填什么?
举报
12#
Fuller 管理员 发表于 2019-4-15 10:30:59 | 只看该作者
henry2144 发表于 2019-4-15 09:39
谢谢。可以连续点击多条了,但是现在又出现了新的问题就是,遇到文字较多,变成两行文字或多行文字的单元格 ...

那一行信息的第二行内容,只有前面一点,后面是空白,所以,点那一行中心点的话很容易点不到链接。

在高级设置中,有个精确点击,可以设置点击位置,就是在那个html节点范围内,可以精确控制点击点所在位置的宽高比例,如图,高度的20%,宽度的20%,是从左上角开始算起的,这个比例可能可以点到,如果还不行,把宽度的比例进一步调小,比如 2%

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报
13#
Fuller 管理员 发表于 2019-4-15 10:32:41 | 只看该作者
henry2144 发表于 2019-4-15 09:53
还有的问题就是对于每一个线索,它在网页里每次点击这些单元格的链接后形成的每个XML文件都重复上上次点击 ...

每做一轮动作,就要采集一次数据,如果采集的目标数据是点击前的内容,或者点击后包括上一轮点击出来的内容,那么一定会重复采集下来。只能在导出了结果文件以后,在excel中进行过滤
举报
14#
henry2144 中级会员 发表于 2019-4-15 10:57:12 | 只看该作者
明白了,谢谢!
举报
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-16 09:28

快速回复 快速发帖 返回顶部 返回列表