21#
Fuller 管理员 发表于 2019-4-17 15:30:29 | 只看该作者
我测试了,只要把这3个的内容映射做上,清除定位标志映射,再为整个整理箱做上样例复制映射,就能采集了
举报 使用道具
22#
Heart2019 新手上路 发表于 2019-4-17 18:10:33 | 只看该作者
Fuller 发表于 2019-4-17 15:28
我估计你也做过样例复制,还是不行,那是因为下图那3个id的值,每一个样例的都不一样。这样的定位标志不 ...


举报 使用道具
23#
Heart2019 新手上路 发表于 2019-4-17 18:12:50 | 只看该作者
Fuller 发表于 2019-4-17 15:30
我测试了,只要把这3个的内容映射做上,清除定位标志映射,再为整个整理箱做上样例复制映射,就能采集了 ...

好滴好滴,太感谢了。我现在测试一下。
举报 使用道具
24#
Heart2019 新手上路 发表于 2019-4-17 21:23:36 | 只看该作者
Fuller 发表于 2019-4-17 15:28
我估计你也做过样例复制,还是不行,那是因为下图那3个id的值,每一个样例的都不一样。这样的定位标志不 ...

朋友分享的规则,规则名为neglected3,在他的账号可以运行正常,但是在我电脑里就不行了,请问问题的原因是什么呢?我是下载的他的规则,到我的规则管理中名字出现变化了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
25#
Fuller 管理员 发表于 2019-4-17 22:53:14 | 只看该作者
Heart2019 发表于 2019-4-17 21:23
朋友分享的规则,规则名为neglected3,在他的账号可以运行正常,但是在我电脑里就不行了,请问问题的原因 ...

尽量用上定位标志映射,防止网页上的少许变化影响规则的适应性。

下载别人的规则肯定名字会变化,因为所有的规则是不能重名的,下载的时候会给你的规则名后面加一串数字
举报 使用道具
26#
Heart2019 新手上路 发表于 2019-4-17 23:21:57 | 只看该作者
Fuller 发表于 2019-4-17 22:53
尽量用上定位标志映射,防止网页上的少许变化影响规则的适应性。

下载别人的规则肯定名字会变化,因为所 ...

谢谢提点!我尝试用朋友电脑爬取,同样的操作就可以成功,在我自己电脑上就不行,是不是这个软件对电脑系统有什么要求呢?我是window8系统。
举报 使用道具
27#
Fuller 管理员 发表于 2019-4-17 23:28:23 | 只看该作者
Heart2019 发表于 2019-4-17 23:21
谢谢提点!我尝试用朋友电脑爬取,同样的操作就可以成功,在我自己电脑上就不行,是不是这个软件对电脑系 ...

不同的操作系统下,网页内容会有很细微的差别,人眼可能看不出来,但是在DOM结构上可能不同。用上定位标志映射以后,可能会避免这种问题
举报 使用道具
28#
Heart2019 新手上路 发表于 2019-4-18 00:08:11 | 只看该作者
Fuller 发表于 2019-4-17 23:28
不同的操作系统下,网页内容会有很细微的差别,人眼可能看不出来,但是在DOM结构上可能不同。用上定位标 ...

使用上定位映射,怎么抓取列表和翻页呢?未运行前测试结果只显示第一条数据。

举报 使用道具
29#
Fuller 管理员 发表于 2019-4-18 08:54:28 | 只看该作者
Heart2019 发表于 2019-4-18 00:08
使用上定位映射,怎么抓取列表和翻页呢?未运行前测试结果只显示第一条数据。

...

就像我前面帖子说的,如果定位标志中含有编号0,1,2,3之类的,这种一般要避免,因为很可能第一条编号0,第二条编号1,如果规则中使用0,那么只能采集到第一条。

爬虫在生成抓取规则的时候,往往会自动选择定位标志,可能自动选择的刚好不合适,那么可以在点击“测试”按钮以后,查看数据规则,看看生成的XPath有没有发生这种情况,如果有,要手工做定位标志映射,手工选择的可以跳过自动选择的定位标志。

也可以通过点击“定位”按钮,选择偏好class或者偏好id,跳过不合适的定位标志
举报 使用道具
30#
Heart2019 新手上路 发表于 2019-4-18 09:02:21 | 只看该作者
Fuller 发表于 2019-4-18 08:54
就像我前面帖子说的,如果定位标志中含有编号0,1,2,3之类的,这种一般要避免,因为很可能第一条编号0,第 ...

通过修改,测试数据可以显示当页列表数据了,但是下载时还是显示失败。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 为什么用微软的excel无法打开xls文件?powe
  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法

热门用户

GMT+8, 2025-6-21 15:40