|
本帖最后由 ym 于 2016-6-29 09:50 编辑
连续动作执行失败或不执行,可参见集搜客网络爬虫之连续动作常见错误。简单总结错误情况,有以下几点:
1、连续动作的原理就是模拟人浏览网页数据的操作,所以,连续动作的步骤和顺序要与人的操作顺序一致,注意:部分网页会涉及鼠标悬浮的隐性动作,在自定义xpath准确的情况下,请多测试一下动作步骤及顺序。
2、如果是施加动作后再来翻页,那么就要拆成两级规则执行,第一级规则设置连续动作,第二级规则才是建整理箱抓数据并设置翻页。
3、要在MS谋数台的xpath搜索框中测试一下自定义的xpath是否定位到所有动作施加的节点,注意:动作施加的节点要选择合适的节点,一般不要定位到text()节点,在排除前面原因的情况下,请调整xpath定位再做测试。
4、采集时DS打数机窗口不够大,导致需要点击的网页位置没有显示出来,程序找不到要点击的位置,就会报错,这种情况多见于使用笔记本电脑,因为屏幕太小。解决方法:可以选择“集搜”或者使用“爬虫群”,并最大化DS打数机窗口,确保需要点击的网页位置可见。
|
|
共 20 个关于本帖的回复 最后回复于 2016-7-25 22:17