从微博平台看一共有2k+条评论,但是采集下来只有600+是为什么呢?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-11-10 17:35

沙发
Fuller 管理员 发表于 2020-11-10 17:35:33 | 只看该作者
采集微博评论的时候,网速一定要快,而且要稳定,不然很容易中断。另外,如果采集到某个位置,评论被大量删掉了,到那个位置很可能就不往下显示了,也会中断。

另外,看到2000多,实际被删帖剩下不多,也是采不够数的原因。

如果网络不稳定,只能多采集几遍,取数量最多的那一次
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 15:40