微博评论的采集不完整,1.1万条,只采集了163条,什么原因?
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2019-11-14 16:25

沙发
lan_1985 金牌会员 发表于 2019-11-14 15:28:59 | 只看该作者
本帖最后由 lan_1985 于 2019-11-14 16:24 编辑

1、微博评论是瀑布流,一般不可能全部都显示出来,有些博文的评论,虽然有几万条,但是可能只显示200条左右。

2、有些博文的评论虽然显示比较多,采集的时候,要很好的网速和计算机速度,才能采集到更多。
举报 使用道具
板凳
Fuller 管理员 发表于 2019-11-14 16:25:24 | 只看该作者
如果采集数量与预期差别很大,应该手工检查一下,就是把这条微博打开,根据采集到的数量基本上估计出来翻页了多少,手工翻页过去看看。

根据多年采集微博的经验,有些微博评论翻页到某个位置后,就会显示没有更多评论了,但是看到的数字是很大的,很可能是管理员做了评论屏蔽
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简
  • 聚类分析和主题分析中的特征选择参数的设置
  • 为集搜客分词和情感分析扩展模块安装情感分

热门用户

GMT+8, 2026-3-17 10:55