我在编辑美团全聚德评论抓取时,想顺便把用户评分打星抓下来,但是发现他们的评论星级@class值不管几星都是stars-ul stars-light,根本不能转化为有效信息,判断不出分别为几星。任务名为美团北京全聚德评论抓取第三级,有大神教我怎么解决吗?
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-6-2 16:13

Fuller 管理员 发表于 2020-6-2 15:53:12 | 显示全部楼层
美团网页上,5颗星对应5个li,li元素中还有一个i元素,这个元素的class决定了这颗星是否亮。所以,要么针对ul元素做一个抓取网页片段的规则,要么针对li做一个样例复制,每颗星的class分别抓。

如果抓网页片段,数据导出以后,在excel中可以用一个公式统计一下亮的li的个数
举报 使用道具
1842554864 初级会员 发表于 2020-6-2 16:13:36 | 显示全部楼层
本帖最后由 1842554864 于 2020-6-2 16:17 编辑
Fuller 发表于 2020-6-2 15:53
美团网页上,5颗星对应5个li,li元素中还有一个i元素,这个元素的class决定了这颗星是否亮。所以,要么针对 ...

我试过对每一个li进行内容映射,抓取的值是空值,我更改定位于偏向id或者偏向class值都不行。网页片段我抓取到了,我先试试能不能找到计算公式算出点亮几颗星,谢谢大神啦
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 04:00