bqq239 初级会员 发表于 2019-5-5 20:41:43 | 显示全部楼层
maomao 发表于 2019-4-24 09:15
看看这篇帖子的处理方法,https://www.gooseeker.com/doc/thread-11667-1-1.html

想请问一下如何爬取天猫按时间顺序排序的商品评论数据,现在爬取的是按默认顺序来的

举报 使用道具
minkyung 初级会员 发表于 2019-11-7 13:52:04 | 显示全部楼层
请问无效HTTPS导致网站显示的不完全要怎么解决呢?
举报 使用道具
小蜜蜂测试16 中级会员 发表于 2019-11-7 14:18:06 | 显示全部楼层
minkyung 发表于 2019-11-7 13:52
请问无效HTTPS导致网站显示的不完全要怎么解决呢?

是天猫网站的内容显示的不完全吗?
举报 使用道具
minkyung 初级会员 发表于 2019-11-7 14:27:50 | 显示全部楼层
小蜜蜂测试16 发表于 2019-11-7 14:18
是天猫网站的内容显示的不完全吗?

对,网站应该这样显示才对 1.PNG
但是我在gooseeker打开的话会这样 2.PNG
应该是这个导致我采集不了结果吧?
我该怎么解决呢

举报 使用道具
小蜜蜂测试16 中级会员 发表于 2019-11-7 14:46:33 | 显示全部楼层
minkyung 发表于 2019-11-7 14:27
对,网站应该这样显示才对
但是我在gooseeker打开的话会这样
应该是这个导致我采集不了结果吧?

cookie.png
可以按照上图的方法清除一下cookie

不过这样显示的话应该是可以抓取成功的,你把网址发出来,我测试一下
举报 使用道具
sipple 新手上路 发表于 2019-12-7 20:42:31 | 显示全部楼层
采集天猫评论,我点了全部但是只采集到的280条不到是为什么
捕获.PNG
举报 使用道具
Fuller 管理员 发表于 2019-12-7 22:47:08 | 显示全部楼层
sipple 发表于 2019-12-7 20:42
采集天猫评论,我点了全部但是只采集到的280条不到是为什么

采集天猫之前,要在集搜客浏览器上登录天猫。爬虫运行的时候,观察一下有没有翻页采集?
举报 使用道具
zhangyunding 新手上路 发表于 2019-12-12 11:51:46 | 显示全部楼层
评论完全抓取不到呀
举报 使用道具
Fuller 管理员 发表于 2019-12-12 12:23:35 | 显示全部楼层
zhangyunding 发表于 2019-12-12 11:51
评论完全抓取不到呀

在抓取之前,要在集搜客浏览器中登录天猫,然后再运行爬虫

抓取失败的商品网址是什么?发出来我测试一下
举报 使用道具
是圆周率那个pi 新手上路 发表于 2020-4-20 15:18:45 | 显示全部楼层
为什么显示“已采集”但是打包数据是0条?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 23:39