采集亚马逊评论数据怎样能采集到评论中有无图片
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-7-24 11:06

wangyong 版主 发表于 2020-7-24 11:06:50 | 显示全部楼层
网络爬虫遵循的是所见即所得的采集原理,采集下来的内容一定是网页上显示的内容。

评论内容中不会直接显示有无图片,但是有图片的评论在评论中会包含评论网址。

做采集规则时可以把图片内容采集下来,有图片的评论就可以采集到一个图片网址,没有图片的就会是空。

映射图片网址.png

数据采集完成之后,我们可以在Excel中做替换,将有图片网址的内容替换为‘Y’,空的内容替换为‘N’

这样就达到了,图片字段只存‘Y’或‘N’的效果。

Excel替换.png

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 10:26