提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2018-5-26 11:49

沙发
数据集 高级会员 发表于 2018-5-24 18:23:44 | 只看该作者
加载你的规则报错了,内容映射失效了,重新映射再给抓取内容做上定位标志映射,选择定位标志的节点最好选择抓取内容的父级节点

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
shenzhenuser1 版主 发表于 2018-5-24 18:29:56 | 只看该作者
本帖最后由 wangyong 于 2018-5-24 18:31 编辑


1,先选择body下的div给整理箱顶节点做上定位标志映射
2,排名和时间分别要做自定义xpath,参考教程:https://www.gooseeker.com/doc/article-269-1.html

大类排名xpath:
  1. .//*[@class='pdTab']//tr[contains(./td[1]/text(),'Amazon 売れ筋ランキング')]/td[2]
复制代码
上架时间xpath:
  1. .//*[@class='pdTab']//tr[contains(./td[1]/text(),'Amazon.co.jp での取り扱い開始日')]/td[2]
复制代码


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
yxjun1984 禁止发言 发表于 2018-5-25 18:32:29 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
5#
Fuller 管理员 发表于 2018-5-25 19:09:21 | 只看该作者
yxjun1984 发表于 2018-5-25 18:32
我运行了20多条线索都没什么问题啊,您重新加载出现问题,请问问题出在哪里呢?
...

采集的时候虽然没有报错,但是有可能定位不准,采集到不想用的内容。加载规则的时候,如果定位不准,就直接报错了。出现这种情况的话,就要用上定位标志映射,可以精准定位,参看教程《定位标志精确采集范围》。

你按照楼上说的,给抓取内容尽量用上定位标志映射,除非没有合适的定位标志
举报 使用道具
6#
yxjun1984 禁止发言 发表于 2018-5-26 11:16:34 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
举报 使用道具
7#
Fuller 管理员 发表于 2018-5-26 11:49:56 | 只看该作者
yxjun1984 发表于 2018-5-26 11:16
整体箱子做顶级定位映射是什么意义和作用?

可以替代样例复制映射,要比样例复制映射更好,用法参看《定位标志采集列表数据
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-6 12:27