上级主题名:京东电饭煲第二级
下级主题名:京东电饭煲第三级
急!!
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2020-4-2 11:03

沙发
远大贾丽 初级会员 发表于 2020-4-1 11:06:09 | 只看该作者
下级有独立网址的话,可以采集网址做层级采集试试。
举报 使用道具
板凳
Fuller 管理员 发表于 2020-4-1 11:58:29 | 只看该作者
我昨天晚上加载过你的规则,发现规则有些问题,当时没有来得及仔细分析,但是今天已经搜不到这个规则了,你把规则删了?

要提高规则的适应性,应该尽量用上定位标志映射:https://www.gooseeker.com/doc/article-344-1.html
举报 使用道具
地板
caizishan 初级会员 发表于 2020-4-1 18:40:26 | 只看该作者
Fuller 发表于 2020-4-1 11:58
我昨天晚上加载过你的规则,发现规则有些问题,当时没有来得及仔细分析,但是今天已经搜不到这个规则了,你 ...

我改了,之后运行几条还是成功,但是后面运行就一直失败了,不知道是二级问题还是三级问题。 第一级主题:京东电饭煲1    第二级主题:京东电饭煲2     第三级主题:京东电饭煲3

举报 使用道具
5#
Fuller 管理员 发表于 2020-4-1 23:00:34 | 只看该作者
设置成绝对定位,采集一次也许可以,多了肯定失败,像京东这种大网站,随时都会在网页上显示一条促销之类的信息,那么绝对定位的规则就失效了。改成偏好class试试
举报 使用道具
6#
caizishan 初级会员 发表于 2020-4-1 23:49:52 | 只看该作者
Fuller 发表于 2020-4-1 23:00
设置成绝对定位,采集一次也许可以,多了肯定失败,像京东这种大网站,随时都会在网页上显示一条促销之类的 ...

我改了,而且还做了定位映射,可是第二级总是定位不到no.3.4,是我的定位映射做错了吗
举报 使用道具
7#
caizishan 初级会员 发表于 2020-4-1 23:53:00 | 只看该作者
Fuller 发表于 2020-4-1 23:00
设置成绝对定位,采集一次也许可以,多了肯定失败,像京东这种大网站,随时都会在网页上显示一条促销之类的 ...

我改了,定位标志映射也做了,但是第二级的no3.4的定位标志加载之后就没了,所以总是失败
举报 使用道具
8#
Fuller 管理员 发表于 2020-4-2 07:18:49 | 只看该作者
caizishan 发表于 2020-4-1 23:53
我改了,定位标志映射也做了,但是第二级的no3.4的定位标志加载之后就没了,所以总是失败
...



抓取第二级的时候,如果开了自动滚屏,屏幕滚动的时候,“评价”那条就会浮到顶部,class值就变了。要么手工编辑翻页规则。要么指定翻页区的时候,选id='detail'的节点。

整理箱里面的 品牌 和 介绍 是要采集什么内容?加载规则定位不到,应该加上定位标志映射
举报 使用道具
9#
Fuller 管理员 发表于 2020-4-2 07:18:49 | 只看该作者
caizishan 发表于 2020-4-1 23:53
我改了,定位标志映射也做了,但是第二级的no3.4的定位标志加载之后就没了,所以总是失败
...



抓取第二级的时候,如果开了自动滚屏,屏幕滚动的时候,“评价”那条就会浮到顶部,class值就变了。要么手工编辑翻页规则。要么指定翻页区的时候,选id='detail'的节点。

整理箱里面的 品牌 和 介绍 是要采集什么内容?加载规则定位不到,应该加上定位标志映射
举报 使用道具
10#
caizishan 初级会员 发表于 2020-4-2 10:53:45 | 只看该作者
Fuller 发表于 2020-4-2 07:18
抓取第二级的时候,如果开了自动滚屏,屏幕滚动的时候,“评价”那条就会浮到顶部,class值就变了。要 ...

品牌和介绍我设置了定位标志了,可是还是失败,每次重新加载就不见了那两个定位标志

360截图20200402100203852.jpg (136.62 KB, 下载次数: 720)

360截图20200402100203852.jpg

360截图20200402100107167.jpg (130.09 KB, 下载次数: 757)

360截图20200402100107167.jpg
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 19:55