11#
Heart2019 新手上路 发表于 2019-4-16 11:05:33 | 只看该作者
Fuller 发表于 2019-4-16 09:43
你在什么时候遇到这个提示的?能截个图看看吗?

测试时是显示正常的,我用同样的规则爬取gooseeker主页就可以爬取成功。提示网页地址过长。

举报 使用道具
12#
Fuller 管理员 发表于 2019-4-16 11:26:58 | 只看该作者
Heart2019 发表于 2019-4-16 11:05
测试时是显示正常的,我用同样的规则爬取gooseeker主页就可以爬取成功。提示网页地址过长。

...

你遇到的失败,跟截断网址没有关系。是规则不合适。建议给抓取内容做上定位标志映射,可以提高规则的适应性。
举报 使用道具
13#
Heart2019 新手上路 发表于 2019-4-16 20:49:36 | 只看该作者
Fuller 发表于 2019-4-16 11:26
你遇到的失败,跟截断网址没有关系。是规则不合适。建议给抓取内容做上定位标志映射,可以提高规则的适应 ...

请教大神,按照要求做了定位映射,但是不知道该怎么做一页的爬取,只显示第一条数据。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
14#
wangyong 版主 发表于 2019-4-17 10:29:26 | 只看该作者
Heart2019 发表于 2019-4-16 20:49
请教大神,按照要求做了定位映射,但是不知道该怎么做一页的爬取,只显示第一条数据。
...

整理箱的定位改成偏好class
举报 使用道具
15#
Fuller 管理员 发表于 2019-4-17 11:28:32 | 只看该作者
Heart2019 发表于 2019-4-16 20:49
请教大神,按照要求做了定位映射,但是不知道该怎么做一页的爬取,只显示第一条数据。
...

你的主题名是什么呢?你的截图刚好把主题名盖住了,没法帮你诊断问题
举报 使用道具
16#
Heart2019 新手上路 发表于 2019-4-17 12:27:42 | 只看该作者
Fuller 发表于 2019-4-17 11:28
你的主题名是什么呢?你的截图刚好把主题名盖住了,没法帮你诊断问题

你好,截图右上角有的,plos-G1
举报 使用道具
17#
Fuller 管理员 发表于 2019-4-17 12:37:22 | 只看该作者
Heart2019 发表于 2019-4-17 12:27
你好,截图右上角有的,plos-G1

plos开头的有好几个,但是没有 plos-G1
举报 使用道具
18#
Heart2019 新手上路 发表于 2019-4-17 12:45:28 | 只看该作者
Fuller 发表于 2019-4-17 12:37
plos开头的有好几个,但是没有 plos-G1

不好意思,可能后来被我修改了,我再试一下,按照之前说的修改定位为class 试一下

举报 使用道具
19#
Heart2019 新手上路 发表于 2019-4-17 13:24:46 | 只看该作者
Fuller 发表于 2019-4-17 12:37
plos开头的有好几个,但是没有 plos-G1

您好,我重新测试了一下,麻烦您看一下错误在哪里,谢谢!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
20#
Fuller 管理员 发表于 2019-4-17 15:28:25 | 只看该作者
Heart2019 发表于 2019-4-17 13:24
您好,我重新测试了一下,麻烦您看一下错误在哪里,谢谢!

我估计你也做过样例复制,还是不行,那是因为下图那3个id的值,每一个样例的都不一样。这样的定位标志不能用

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 为什么用微软的excel无法打开xls文件?powe
  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法

热门用户

GMT+8, 2025-6-21 12:55