本帖最后由 liuyan520 于 2020-5-26 14:05 编辑

1688产品二级规则总是提示我规则失败,我加了定位映射也不行,求解
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2020-5-26 18:13

Fuller 管理员 发表于 2020-5-26 14:41:34 | 显示全部楼层
因为是二级规则,一定是要采集很多网址,那么这个规则的适应性要很高,首先要尽量用上定位标志映射,如果还有错误,可以按照这个帖子加载分析一下失败线索:https://www.gooseeker.com/doc/thread-13085-1-1.html

如果需要管理员加载分析规则,请发出来规则名字
举报 使用道具
liuyan520 初级会员 发表于 2020-5-26 16:25:51 | 显示全部楼层
Fuller 发表于 2020-5-26 14:41
因为是二级规则,一定是要采集很多网址,那么这个规则的适应性要很高,首先要尽量用上定位标志映射,如果还 ...

速食产品选品二级规则  嘿嘿 谢谢啦
举报 使用道具
liuyan520 初级会员 发表于 2020-5-26 16:38:28 | 显示全部楼层
我找到了原因了,写的是无法定位容器  可是我已经做了定位映射
举报 使用道具
Fuller 管理员 发表于 2020-5-26 16:43:14 | 显示全部楼层
定位20200526164035.png

你这个规则看起来没有多少内容,但是这些内容分别属于不同的区域,比如,红框里面的。如果把他们放在同一个整理箱中,一定要用上定位标志映射。

最后两个定位标志你选择了相同的class,这样就会采集下来重复的内容。所以,你设置了绝对定位,对这种网页来说,绝对不能用绝对定位,适应性太差了。尽量用偏好class或者偏好id。如果发现有抓取内容重复了,要选择合适的能区分的定位标志。比如,最后两个抓取内容,应该用这两个很特别的定位标志(红色箭头)
举报 使用道具
Fuller 管理员 发表于 2020-5-26 16:44:09 | 显示全部楼层
liuyan520 发表于 2020-5-26 16:38
我找到了原因了,写的是无法定位容器  可是我已经做了定位映射

当加载规则的时候,如果说无法定位容器,可以先忽略,再一次点击“测试”按钮,可能就没有这个提示了,这是因为你没有给最顶上的抓取内容做定位标志映射
举报 使用道具
liuyan520 初级会员 发表于 2020-5-26 17:22:30 | 显示全部楼层
Fuller 发表于 2020-5-26 16:43
你这个规则看起来没有多少内容,但是这些内容分别属于不同的区域,比如,红框里面的。如果把他们放在同一 ...

是按您说的做了定位映射,然后偏好class,可是还是失败,哎
举报 使用道具
Fuller 管理员 发表于 2020-5-26 18:13:35 | 显示全部楼层
liuyan520 发表于 2020-5-26 17:22
是按您说的做了定位映射,然后偏好class,可是还是失败,哎

回头率是关于店铺的,在另一个网页区域中。我建议专门建立一个整理箱存这个字段

重复采购率和采购人数,类似,再另外建立一个整理箱。

在创建规则工作台上,右边那个“创建”按钮和“删除”按钮是创建和删除整理箱的。

用多个整理箱,可以提高适应性,但是,导出数据的时候是分到不同的表中。需要根据fullpath这个字段匹配他们。

另外,可以加载分析失败线索,看看到底是哪个字段失败了。参看:https://www.gooseeker.com/doc/thread-13085-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 06:00