快捷导航
wen2019 新手上路 发表于 2023-1-13 17:15:02 | 显示全部楼层
试了好多次只能抓取80条天猫商品评论数据,这个链接,可以帮忙看看吗
https://detail.tmall.com/item.htm?abbucket=3&id=617383184207&ns=1&spm=a230r.1.14.6.5ce332773CeOkp
举报 使用道具
gz51837844 管理员 发表于 2023-1-13 23:53:04 | 显示全部楼层
wen2019 发表于 2023-1-13 17:15
试了好多次只能抓取80条天猫商品评论数据,这个链接,可以帮忙看看吗
https://detail.tmall.com/item.htm?a ...

是的,天猫商品评论改版了,默认排序只显示这么多条评论,所以只能采集到这么多。
你还可以再使用另一个快捷采集:天猫商品评论_按时间排序采集,这个快捷采集是按时间排序显示评论。
这样会多采集一些数据
举报 使用道具
刘小凡 新手上路 发表于 2023-2-27 21:05:50 | 显示全部楼层
请问为什么天猫商品评论采集只能输出几十条呢?选择了50页,但是输出几十条数据就自动截止了。
举报 使用道具
Fuller 管理员 发表于 2023-2-27 22:34:39 | 显示全部楼层
刘小凡 发表于 2023-2-27 21:05
请问为什么天猫商品评论采集只能输出几十条呢?选择了50页,但是输出几十条数据就自动截止了。 ...

在采集之前,要在爬虫浏览器中登录天猫。在采集过程中,注意观察爬虫窗口,看看天猫有没有出现验证码,要是出现验证码,要赶快滑一下滑块验证码
举报 使用道具
刘小凡 新手上路 发表于 2023-3-1 17:50:14 | 显示全部楼层
Fuller 发表于 2023-2-27 22:34
在采集之前,要在爬虫浏览器中登录天猫。在采集过程中,注意观察爬虫窗口,看看天猫有没有出现验证码,要 ...

滑完滑块后,不久还是自动停止收集了,请问是什么原因呀是不是滑的太慢了

举报 使用道具
Fuller 管理员 发表于 2023-3-1 18:05:31 | 显示全部楼层
刘小凡 发表于 2023-3-1 17:50
滑完滑块后,不久还是自动停止收集了,请问是什么原因呀是不是滑的太慢了

...

目前天猫封锁的很厉害,采集不了太多评论
举报 使用道具
刘小凡 新手上路 发表于 2023-3-1 20:14:55 | 显示全部楼层
Fuller 发表于 2023-3-1 18:05
目前天猫封锁的很厉害,采集不了太多评论

请问目前有什么比较好的解决方法吗
举报 使用道具
VIP版测试285485 初级会员 发表于 2023-3-31 18:44:59 | 显示全部楼层
打包完成后下载的格式是all files是怎么回事
举报 使用道具
Fuller 管理员 发表于 2023-3-31 22:16:23 | 显示全部楼层
VIP版测试285485 发表于 2023-3-31 18:44
打包完成后下载的格式是all files是怎么回事

下载的时候,不要改文件的名字
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系
  • 知乎话题文本分词后的共词矩阵怎样引入词语

热门用户

GMT+8, 2024-2-26 14:36