举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2016-9-29 16:01

沙发
HJLing 版主 发表于 2016-8-10 17:06:05 | 只看该作者
有一种方法是对店铺星级的链接做一个层级抓取

进去到卖家信息页面后 店铺星级是以图片格式存在 通过图片的名称可以知道店铺星级


举报 使用道具
板凳
ym 版主 发表于 2016-9-29 16:01:06 | 只看该作者
本帖最后由 ym 于 2016-9-29 16:06 编辑

上面的方法是可以的,但是有的店铺是不显示星级的,这种就要自定义xpath来抓星级的链接,参考教程http://www.gooseeker.com/doc/article-269-1.html


另一种方法是把星级的节点直接映射给一个标签,高级设置里勾上网页片段,这样就会把店铺星级那块的html抓取下来,后面在excel里可以统计各个等级名称的出现次数

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 12:57