大大们,在操作中遇到了几个问题,跪求指导,在线等,挺急的~
第一个问题:在进行翻页设置时,亚马逊的翻页标“Next pagge ”无法找到EM,设置Next page 后翻页失败。提示:记号值为空

第二个问题:
保存第一级别后报错:
两个样例的XPath表达式的路径长度不一样。
映射给两个样例的应该是具有相同父节点的兄弟节点

第三个问题:
在第二级设置时,指导教程的:命名主题-页面地址 为空,但是我的打开后有默认的一个网址,删掉里面的网址删不删都报错
“因为前面的原因生成的抓取规则文件是空的。
跳过”



举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2019-2-23 22:42

沙发
maomao 论坛元老 发表于 2019-2-23 15:39:54 | 只看该作者
规则名是什么?
举报 使用道具
板凳
yoyobear 新手上路 发表于 2019-2-23 16:08:38 | 只看该作者
银手链
二级是:银手链搜索第二级
举报 使用道具
地板
Fuller 管理员 发表于 2019-2-23 16:21:07 | 只看该作者
yoyobear 发表于 2019-2-23 16:08
银手链
二级是:银手链搜索第二级

翻页那级的主题名是什么?
举报 使用道具
5#
Fuller 管理员 发表于 2019-2-23 16:23:15 | 只看该作者
yoyobear 发表于 2019-2-23 16:08
银手链
二级是:银手链搜索第二级

如果遇到 映射给两个样例的应该是具有相同父节点的兄弟节点 这类提示,到教程那里搜索这句话就能看到答案,教程的网址是:https://www.gooseeker.com/tuto/tutorial.html


可以搜到这个具体说明:https://www.gooseeker.com/doc/thread-653-1-1.html
举报 使用道具
6#
Fuller 管理员 发表于 2019-2-23 16:44:08 | 只看该作者
你的规则加载不成功,建议先看初级教程,按照顺序看一下前面几篇。从教程首页进入,展开左栏教程,找到初级教程:https://www.gooseeker.com/tuto/tutorial.html

翻页那里只需要定义一个翻页规则就行了,我看到你定义了2个,就不对了。不要用绝对定位,应该选择偏好class,亚马逊的网页会动态变化,用绝对定位一定会抓取失败
举报 使用道具
7#
yoyobear 新手上路 发表于 2019-2-23 18:24:19 | 只看该作者
Fuller 发表于 2019-2-23 16:44
你的规则加载不成功,建议先看初级教程,按照顺序看一下前面几篇。从教程首页进入,展开左栏教程,找到初级 ...

非常感谢,我就是对着视频操作的。你的提醒下,终于翻页的搞定了。关于翻页还有一个问题:“
同一线索内翻页次数‘’这个设置在存完规则以后再回来会员中心设置吗?然后设置好了再去定义规则/DS打数机 开始爬数据?

如果没有设置好就已经开始爬了,不想要它爬太多,哪里可以点击暂停吗?

二级的我再试试,麻烦啦~
期待你们周末持续在线 笔芯

举报 使用道具
8#
Fuller 管理员 发表于 2019-2-23 22:42:21 | 只看该作者
yoyobear 发表于 2019-2-23 18:24
非常感谢,我就是对着视频操作的。你的提醒下,终于翻页的搞定了。关于翻页还有一个问题:“同一线索内翻 ...

手工启动的采集,不能设置翻页次数,只能等翻页够数了强制关闭窗口。手工启动的采集包括:
1,定义规则完成后点击“爬数据”按钮
2,在DS打数机窗口中执行单搜或者集搜

如果设置了爬虫群调度方式,在调度参数中可以设置翻页次数,具体参看《开启多爬虫采集
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-6 02:28