集搜客网络爬虫之连续动作常见错误

2016-6-20 15:05| 发布者: HJLing| 查看: 6387| 评论: 0

摘要: 学到这里,想必大家对于网页数据抓取都已经得心应手了,也开始学习连续动作,但有时候好不容易写完了连续动作的表达式,DS打数机却不会做动作,也不知道错在哪里,无从下手进行检查修改。下面对于用户常见的错误进行 ...

学到这里,想必大家对于网页数据抓取都已经得心应手了,也开始学习连续动作,但有时候好不容易写完了连续动作的表达式,DS打数机却不会做动作,也不知道错在哪里,无从下手进行检查修改。下面对于用户常见的错误进行汇总,大家可以根据下面列出的常见错误进行排查。

一、动作类型选择错误
如上图所示的下拉选择框,在MS谋数台里只需要定义一个“选择”动作即可。
注意:动作的定位表达式写到“select”而不是“option”,否则程序不会执行该动作。


程序会按顺序将每一个选项都选择一次,如果需要指定选择某一个选项,则需要在高级设置里,设置动作的起点和设置一个较大的跨度,就能让选择动作指定选择某一个选项。



二、动作定位表达式有误

自定义动作Xpath路径时,需要保证路径的准确性,否则会报错。可以通过MS来校验路径是否正确。
同时还应该注意搜索到的节点总数和网页上看到的是否一致。


二、DS打数机窗口不够大

采集时DS打数机窗口不够大,导致需要点击的网页位置没有显示出来,程序找不到要点击的位置,就会报错,这种情况多见于使用笔记本电脑,因为屏幕太小。
可以选择“集搜”或者使用“爬虫群”,并最大化DS打数机窗口,确保需要点击的网页位置可见。



还有其他问题的欢迎在下面评论留言。希望大家能够在网页数据抓取的道路上走得越来越通畅。



2

鲜花

握手

雷人

路过

鸡蛋

刚表态过的朋友 (2 人)

最新评论

GMT+8, 2024-3-28 16:52