无法定位记号 经检查,记号(下一页)不符合要求,原因:节点号不正确,这是什么原因
举报 使用道具
| 回复

共 11 个关于本帖的回复 最后回复于 2019-6-29 15:41

沙发
Fuller 管理员 发表于 2016-10-17 19:06:04 | 只看该作者
是加载以前定义的规则遇到这个问题的吧?如果是这样,可能是下面的原因

1)规则定义的不合适,比如,选择了不合适的定位标志,可以修改“定位选项”选个合适的,参看:http://www.gooseeker.com/doc/thread-3701-1-1.html

2)网页结构变化了,那么就需要重新做映射

具体情况要具体分析,你可以把规则名帖出来,我们做检查
举报 使用道具
板凳
GGLNOVA 新手上路 发表于 2019-6-29 01:14:01 | 只看该作者
Fuller 发表于 2016-10-17 19:06
是加载以前定义的规则遇到这个问题的吧?如果是这样,可能是下面的原因

1)规则定义的不合适,比如,选择 ...

管理员在吗?我遇到了同样的问题,想请你帮我查看一下
举报 使用道具
地板
Fuller 管理员 发表于 2019-6-29 08:56:59 | 只看该作者
GGLNOVA 发表于 2019-6-29 01:14
管理员在吗?我遇到了同样的问题,想请你帮我查看一下

你做的任务名是什么?贴出来让管理员加载分析一下
举报 使用道具
5#
GGLNOVA 新手上路 发表于 2019-6-29 09:31:33 | 只看该作者
Fuller 发表于 2019-6-29 08:56
你做的任务名是什么?贴出来让管理员加载分析一下

亚马逊书籍搜索
亚马逊书籍搜索1.0
亚马逊书籍搜索2.0
1.0是的第一个的下级搜索
2.0是1.0的下级搜索
十分感谢
举报 使用道具
6#
GGLNOVA 新手上路 发表于 2019-6-29 09:35:01 | 只看该作者
Fuller 发表于 2019-6-29 08:56
你做的任务名是什么?贴出来让管理员加载分析一下

第三个在运行时开始的几个线索可以正常抓取,但是之后就在状态栏的剩余线索之后显示匹配失败
举报 使用道具
7#
GGLNOVA 新手上路 发表于 2019-6-29 09:45:39 | 只看该作者
Fuller 发表于 2019-6-29 08:56
你做的任务名是什么?贴出来让管理员加载分析一下

这是测试两条线索时的结果

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
8#
Fuller 管理员 发表于 2019-6-29 12:32:18 | 只看该作者
GGLNOVA 发表于 2019-6-29 09:45
这是测试两条线索时的结果


amazon网页采集规则稍微有点难做。

首先,你应该尽量用上定位标志映射:https://www.gooseeker.com/doc/article-344-1.html
定位标志映射可以大大提高规则的适应性。就像上图,那些class的值很有含义,比如a-profile-name是关于人名,review-data是关于评论内容,review-date是关于评论时间。用上这些定位标志可以有效提高规则适应性。

其次,amazon的这些class值不是单纯的语义,有些很长,里面含有网页样式的内容。一开始我说有点难做就在这里,含有的这些网页样式的class值会变。如果你用上定位标志映射以后发现还有失败的,要用自定义xpath,手工修改一下xpath,把那些网页样式的内容删除,只保留语义部分

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
9#
GGLNOVA 新手上路 发表于 2019-6-29 12:48:28 | 只看该作者
Fuller 发表于 2019-6-29 12:32
amazon网页采集规则稍微有点难做。

首先,你应该尽量用上定位标志映射:https://www.gooseeker.com/doc ...

谢谢管理员,太感谢了。我先看一看试一试,但是对我(新手)而言手工修改可能找不着北
举报 使用道具
10#
GGLNOVA 新手上路 发表于 2019-6-29 12:53:02 | 只看该作者
Fuller 发表于 2019-6-29 12:32
amazon网页采集规则稍微有点难做。

首先,你应该尽量用上定位标志映射:https://www.gooseeker.com/doc ...

我老师也只是稍微说了一下基本操作,自己运行起来发现了各种问题
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 为什么用微软的excel无法打开xls文件?powe
  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法

热门用户

GMT+8, 2025-6-15 05:59