问题:我悬浮结果的二级页面pageno全是0,抓前几页好着,后面第50也就失败
规则:我的悬浮样本1
我的悬浮样本2。
回答说二级没有翻页才为0,有没有别的方式可以匹配一级悬浮二级

举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-4-23 14:54

沙发
Fuller 管理员 发表于 2017-4-23 14:54:30 | 只看该作者
第一级规则的结果文件,注意看红框中的字段


第二级规则的前3次动作完成后生成的结果文件
第一次动作:

第二次动作

第三次动作


clueid在整个抓取过程中都是不变的,但是,我们可以使用actionno区分出来这是第几个动作,而prestamp区分出来上一级是哪个页面(对应于上一级的currentstamp)

我们再看翻到第二页,第一级如下


而第二级前3次动作的结果
第一次动作

第二次动作

第三次动作


此时,想使用pageno是不行的,到第二页时,第二级的结果文件pageno仍然是0,也就是说,pageno是指当前主题翻页数量,而不是上级主题传递过来的数字。此时只有依赖于prestamp和currentstamp来配对。prestamp是上级窗口打开时的时间戳和名称,是传递给下一级的。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简
  • 聚类分析和主题分析中的特征选择参数的设置

热门用户

GMT+8, 2026-3-26 03:22