求帮看帖,是什么原因呀,"库存**件"明明就在一个text结点里面,但是会有只抓到“库存”的情况,但是把这些线索重新激活,就又能全部抓到,这要怎么解决呢,求教
《商品详情页-1030》  规则主题



举报 使用道具
| 回复

共 12 个关于本帖的回复 最后回复于 2016-11-9 16:43

沙发
qingmu888 中级会员 发表于 2016-11-9 14:29:49 | 只看该作者
本来我没有对列表进行定位标志映射的,但是会出现“无法定位容器 No.0”情况
举报 使用道具
板凳
xandy 论坛元老 发表于 2016-11-9 14:36:05 | 只看该作者
本帖最后由 xandy 于 2016-11-9 14:38 编辑

库存所在的EM节点,不管其id或者是class都是唯一的,
定位你可以改为偏好class试试,不用绝对定位。

另外三个价格所在的SPAN的class虽然相同,但你可以再往上找到不同的祖先节点,比如下面三个分别是三个价格的祖先节点

它们的class都是不一样的,分别用这三个节点给三个价格做定位标志映射

举报 使用道具
地板
qingmu888 中级会员 发表于 2016-11-9 14:43:11 | 只看该作者
xandy 发表于 2016-11-9 14:36
库存所在的EM节点,不管其id或者是class都是唯一的,
定位你可以改为偏好class试试,不用绝对定位。

那请问对 列表做定位标志映射 有必要吗?

举报 使用道具
5#
xandy 论坛元老 发表于 2016-11-9 15:11:12 | 只看该作者
qingmu888 发表于 2016-11-9 14:43
那请问对 列表做定位标志映射 有必要吗?

列表做定位也是可以限定采集范围的,可做
举报 使用道具
6#
Fuller 管理员 发表于 2016-11-9 15:11:16 | 只看该作者
qingmu888 发表于 2016-11-9 14:43
那请问对 列表做定位标志映射 有必要吗?

如果能找到一个合适的定位标志,那么,做定位标志映射还是很有用的,虽然是顶层容器节点,但是做了映射以后会为整个整理箱划定一个范围。如果不做定位标志映射,那么会根据定位偏好自动划定范围,很可能就会不合适
举报 使用道具
7#
qingmu888 中级会员 发表于 2016-11-9 15:16:48 | 只看该作者
Fuller 发表于 2016-11-9 15:11
如果能找到一个合适的定位标志,那么,做定位标志映射还是很有用的,虽然是顶层容器节点,但是做了映射以 ...

好的,谢谢你
举报 使用道具
8#
qingmu888 中级会员 发表于 2016-11-9 15:19:47 | 只看该作者
xandy 发表于 2016-11-9 14:36
库存所在的EM节点,不管其id或者是class都是唯一的,
定位你可以改为偏好class试试,不用绝对定位。

你好,我用你的方式试了,本来815条链接,用绝对定位,专柜价抓空了15个,改为这种地位标志映射后,抓空了346个???,库存 的情况还是存在,只是从原来的15变为了7个,
举报 使用道具
9#
qingmu888 中级会员 发表于 2016-11-9 15:20:50 | 只看该作者
xandy 发表于 2016-11-9 15:11
列表做定位也是可以限定采集范围的,可做

嗯嗯,做了
举报 使用道具
10#
xandy 论坛元老 发表于 2016-11-9 16:01:44 | 只看该作者
qingmu888 发表于 2016-11-9 15:19
你好,我用你的方式试了,本来815条链接,用绝对定位,专柜价抓空了15个,改为这种地位标志映射后,抓空了 ...

规则是要多做调试的,结合修改定位或者自定义xpath,再看看你的最优采集规则是哪个
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-20 03:52