快捷导航
Fuller 管理员 发表于 2019-4-15 16:39:56 | 显示全部楼层
goodhanbin 发表于 2019-4-15 16:28
第一级点击浏览次数,就弹出一个来访时间列表,那个来访时间就在这个列表上,为什么会采集不到呢?难道还要 ...

没错啊,就是两级规则:
第一级规则:点击浏览次数,弹出一个窗口,交给第二个规则去采集
第二级规则:采集这个窗口上的访问时间,再做一个动作,点击X关闭窗口,目标主题名是第一级规则
这样就形成了一个循环
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-15 16:48:04 | 显示全部楼层
Fuller 发表于 2019-4-15 16:39
没错啊,就是两级规则:
第一级规则:点击浏览次数,弹出一个窗口,交给第二个规则去采集
第二级规则:采 ...

现在,出现新问题,

二级规则导出数据后,actionvalue值 ,只有每一页的第一行,通过第一级规则采集并联到,其他9行没有
[url=][/url]
[url=]删除[/url]




点击图片添加到帖子内容中
文件尺寸: 小于 5.9MB , 可用扩展名: jpg, jpeg, gif, png


二级规则数据

二级规则数据
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-15 16:54:03 | 显示全部楼层
第二级规则,连续动作,有设置,关闭窗口,
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-15 17:15:38 | 显示全部楼层
Fuller 发表于 2019-4-15 16:39
没错啊,就是两级规则:
第一级规则:点击浏览次数,弹出一个窗口,交给第二个规则去采集
第二级规则:采 ...

按之前,您给的一级规则中actionvalue值,内容表达式:./../../td[@class='td-visitor align-left']/a[position()=1]/text()


但是,实际二级规则,导出数据后,只有每一页,第一行才有,其他9行,无

内容表达式

内容表达式
举报 使用道具
Fuller 管理员 发表于 2019-4-15 17:26:58 | 显示全部楼层
goodhanbin 发表于 2019-4-15 17:15
按之前,您给的一级规则中actionvalue值,内容表达式:./../../td[@class='td-visitor align-left']/a/te ...

如果第二级规则,只有一个动作,点击X号,那么不可能有多条数据采集,要么就是你还定义了其他动作,要么就是点击X号的定位表达式不对,能定位到多个节点
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-15 17:36:31 | 显示全部楼层
二级规则,有两个动作,一个动作点浏览次数,一个动作,点击X号,关闭窗口

动作2关闭X号

动作2关闭X号
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-15 17:39:36 | 显示全部楼层
Fuller 发表于 2019-4-15 17:26
如果第二级规则,只有一个动作,点击X号,那么不可能有多条数据采集,要么就是你还定义了其他动作,要么 ...

二级规则,关闭窗口X动作

关闭动作窗口

关闭动作窗口
举报 使用道具
Fuller 管理员 发表于 2019-4-15 17:53:56 | 显示全部楼层
goodhanbin 发表于 2019-4-15 17:36
二级规则,有两个动作,一个动作点浏览次数,一个动作,点击X号,关闭窗口 ...

点击浏览次数是第一级规则做,不能放在第二级规则。

第二级规则的连续动作的目标主题指向第一级,这样就形成了一个循环
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-15 18:00:23 | 显示全部楼层
点击浏览次数,第二级不做,一级规则数据:第一页,只会采集一行,并且会直接跳转到第二页第一页
举报 使用道具
goodhanbin 中级会员 发表于 2019-4-15 18:15:38 | 显示全部楼层
Fuller 发表于 2019-4-15 17:53
点击浏览次数是第一级规则做,不能放在第二级规则。

第二级规则的连续动作的目标主题指向第一级,这样就 ...

第二级规则,连续动作:浏览次数,不做,只做一个动作:关闭窗口,那么二级规则数据,每一页,只会采集每一页第一行数据,并直接跳转至第二页第一行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 爬网址做层级采集——以京东商品爬虫为例
  • 网络爬虫软件翻页采集列表数据
  • 定义爬虫规则采集网页数据
  • 网络爬虫采集列表数据
  • 集搜客网络爬虫的核心名词

热门用户

GMT+8, 2020-11-28 00:23