从微博平台看一共有2k+条评论,但是采集下来只有600+是为什么呢?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-11-10 17:35

沙发
Fuller 管理员 发表于 2020-11-10 17:35:33 | 只看该作者
采集微博评论的时候,网速一定要快,而且要稳定,不然很容易中断。另外,如果采集到某个位置,评论被大量删掉了,到那个位置很可能就不往下显示了,也会中断。

另外,看到2000多,实际被删帖剩下不多,也是采不够数的原因。

如果网络不稳定,只能多采集几遍,取数量最多的那一次
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • UMAP的min_dist参数有什么作用?
  • UMAP的n_neighbors参数有什么作用?
  • HDBSCAN的min_samples和min_cluster_size参
  • 为什么BERTopic话题缩减后特征词出现大量没
  • GooSeeker分词扩展模块的安装方法

热门用户

GMT+8, 2026-6-18 11:08