问下各位大神,美团外卖抓取二级页面时只能抓取一套菜品、单价、销量,其他菜品不能抓取,为什么?
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-11-17 11:09

umsung 高级会员 发表于 2017-11-16 17:09:24 | 显示全部楼层
用层级采集抓取二级页面的信息,只抓取到一条的原因可能是:
1,一级规则的目标主题名没有和二级规则的主题名对应一致,导致一级规则生成的线索没有到二级规则中去,从而二级规则就只有一条线索,所以就只能抓取一条信息。
2,运行二级规则时只运行了一条线索,所以只抓取了一条线索。可以右键二级规则-统计线索查看有没有生成线索,如果生成了就是第二种情况,没生成就是第一种情况。

详情参考《层级采集》
举报 使用道具
canige0309 新手上路 发表于 2017-11-17 10:57:46 | 显示全部楼层
umsung 发表于 2017-11-16 17:09
用层级采集抓取二级页面的信息,只抓取到一条的原因可能是:
1,一级规则的目标主题名没有和二级规则的主题 ...

谢谢,就是二级页面我想要抓取菜名、售价、销量,但是只抓取一个菜品的销量,菜名,售价,别的菜品都不抓取,请问这是什么原因?谢谢。

举报 使用道具
umsung 高级会员 发表于 2017-11-17 11:09:25 | 显示全部楼层
本帖最后由 umsung 于 2017-11-17 11:46 编辑
canige0309 发表于 2017-11-17 10:57
谢谢,就是二级页面我想要抓取菜名、售价、销量,但是只抓取一个菜品的销量,菜名,售价,别的菜品都不抓 ...

一个二级页面有很多套菜品吗?可以把网址和规则名贴出来看下,如果二级页面是列表形式的话可以用样例复制批量采集。如果是没有规律的话,就需要做一整块采集。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 12:55