如图片这样的。。。。现在用的【相对线索】
但是采集到第10页的时候,又重新采集1-10页的内容,如何搞定这样的翻页呢?




举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2016-9-19 16:09

沙发
Fuller 管理员 发表于 2016-9-19 08:48:28 | 只看该作者
这里有个翻页问题集锦,这种情形应该是有的:http://www.gooseeker.com/doc/thread-698-1-1.html
你的主题名是什么?贴出来可以让管理员帮你看看
举报 使用道具
板凳
190531668 初级会员 发表于 2016-9-19 09:05:09 | 只看该作者
Fuller 发表于 2016-9-19 08:48
这里有个翻页问题集锦,这种情形应该是有的:http://www.gooseeker.com/doc/thread-698-1-1.html
你的主题 ...

我这个是对单系统。。需要账号和密码的。没法公开啊。
举报 使用道具
地板
Fuller 管理员 发表于 2016-9-19 09:34:02 | 只看该作者
190531668 发表于 2016-9-19 09:05
我这个是对单系统。。需要账号和密码的。没法公开啊。

根据你的截图看,到第11页时,后面的页码规律没有变化,翻页应该没有问题。所以,要这样检查
1)DS打数机下部的日志窗口是否显示失败信息了?是什么日志?
2)在MS谋数台上,先关闭工具条中间的“内容定位”,然后再MS谋数台中翻页,翻到10,选择菜单 文件(新版叫规则)-》刷新页面结构-》分析页面,看看有没有报错,然后分析11页

如果既没有日志,也没有报错,可能到10以后,翻页相关的网页结构变了,在“爬虫路线”工作台上点击“查看规则”按钮,把看到的规则贴出来。可以点击“定位选项”按钮,换一下偏好,比如,偏好class
举报 使用道具
5#
190531668 初级会员 发表于 2016-9-19 11:36:12 | 只看该作者
Fuller 发表于 2016-9-19 09:34
根据你的截图看,到第11页时,后面的页码规律没有变化,翻页应该没有问题。所以,要这样检查
1)DS打数机 ...

嗯,谢谢,。我一会试试看、、

有个细节是这样的:当翻页到10页,就需要点击“...”才能显示第11页。
举报 使用道具
6#
Fuller 管理员 发表于 2016-9-19 13:13:01 | 只看该作者
190531668 发表于 2016-9-19 11:36
嗯,谢谢,。我一会试试看、、

有个细节是这样的:当翻页到10页,就需要点击“...”才能显示第11页。 ...

在第7,或者8页的时候,点击 ... 会怎样?如果都是翻到下一页,那么就用这个记号做翻页
举报 使用道具
7#
190531668 初级会员 发表于 2016-9-19 15:04:25 | 只看该作者
Fuller 发表于 2016-9-19 13:13
在第7,或者8页的时候,点击 ... 会怎样?如果都是翻到下一页,那么就用这个记号做翻页 ...

测试了下。


每段10页。分段用“...”跳转。
就是在7或8页的时候,点击“...”,直接页面跳至11页。。。。。

当页面在11页的时候。。第6页前也会出现“...”,点击后,跳至第5页
举报 使用道具
8#
Fuller 管理员 发表于 2016-9-19 15:19:26 | 只看该作者

似乎像这种,有变化的情况,也许用连续动作可以解决:http://www.gooseeker.com/doc/thread-2410-1-1.html

也许每个分页都有独立url吧?如果有,一切都简单了,把所有分页的网址构造出来。在规则中不用翻页,只抓当前页
举报 使用道具
9#
190531668 初级会员 发表于 2016-9-19 15:49:45 | 只看该作者
Fuller 发表于 2016-9-19 15:19
似乎像这种,有变化的情况,也许用连续动作可以解决:http://www.gooseeker.com/doc/thread-2410-1-1.htm ...

没有分页URL。。网站的URL一直不变。。

红色的是单据编号。。

这个页面。。一段时间会无效。提示登录错误。。重新登录后。。得重新复制。。
登录的感觉和URL的蓝色的有关系。

http://******:端口/%28S%28pojybvsfufzmkhyahx2ldpmn%29%29/VScmBill/VScmBillBody.aspx?Code=1JHYW201609040934
举报 使用道具
10#
190531668 初级会员 发表于 2016-9-19 16:09:57 | 只看该作者
Fuller 发表于 2016-9-19 15:19
似乎像这种,有变化的情况,也许用连续动作可以解决:http://www.gooseeker.com/doc/thread-2410-1-1.htm ...

我现在改用连续动作的方式。。如图,应该怎么设置呢?谢谢!

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-11 19:55