采集亚马逊评论数据怎样能采集到评论中有无图片
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-7-24 11:06

沙发
shenzhenuser1 版主 发表于 2020-7-24 11:06:50 | 只看该作者
网络爬虫遵循的是所见即所得的采集原理,采集下来的内容一定是网页上显示的内容。

评论内容中不会直接显示有无图片,但是有图片的评论在评论中会包含评论网址。

做采集规则时可以把图片内容采集下来,有图片的评论就可以采集到一个图片网址,没有图片的就会是空。



数据采集完成之后,我们可以在Excel中做替换,将有图片网址的内容替换为‘Y’,空的内容替换为‘N’

这样就达到了,图片字段只存‘Y’或‘N’的效果。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • LDA主题分析模型到底是什么?
  • top2vec话题发现原理和使用方法
  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别

热门用户

GMT+8, 2026-4-9 00:05