我想问一下有没有大师爬过京东无线端的搜索结果页,我现在有一个问题,我爬虫的目的是找出每一款商品所属的店铺,其他类目的都可以,但是搜李宁羽绒服的时候问题就来了,第一款商品是自营的,没有显示店铺名称,而第二款就有店铺名称,怎么解决这个问题?

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-11-29 17:47

沙发
HJLing 版主 发表于 2016-11-29 17:19:58 | 只看该作者
用自定义xpath或者用两个规则编号不同的规则
具体你的不一样是怎样 截图或者直接发网址看看
举报 使用道具
板凳
chenhg 初级会员 发表于 2016-11-29 17:31:33 | 只看该作者
附加图片


QQ截图20161129172647.png (80.81 KB, 下载次数: 425)

搜索李宁的没有问题

搜索李宁的没有问题

QQ截图20161129172711.png (163.96 KB, 下载次数: 447)

但是收缩李宁羽绒服的话第一款是自营的

但是收缩李宁羽绒服的话第一款是自营的

QQ截图20161129172722.png (144.38 KB, 下载次数: 439)

第一款

第一款

QQ截图20161129172740.png (44.54 KB, 下载次数: 420)

没有找到店铺名称

没有找到店铺名称

QQ截图20161129172754.png (88.07 KB, 下载次数: 433)

第二款

第二款

QQ截图20161129172807.png (42.32 KB, 下载次数: 408)

可以找到店铺名称

可以找到店铺名称
举报 使用道具
地板
HJLing 版主 发表于 2016-11-29 17:47:30 | 只看该作者
如果只是差了店铺名称 其他结构都一样 可以用第三方店铺做样本页面 也采集店铺名称 但不要勾选关键内容 这样对于自营的页面这个字段就是空的
如果其他信息的结构也有差别 可以建立两个规则 参加教程《怎么在同一个主题名下建立多个规则
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 03:50