1011#
Fuller 管理员 发表于 2020-2-9 16:18:44 | 只看该作者
上海垃圾分类 发表于 2020-2-9 16:14
请问怎么采集微博中,某一条微博,底下的评论?

把那条微博的网址拿到,添加到采集评论的工具中,选择只采评论

https://www.gooseeker.com/land/weibo.html


举报 使用道具
1012#
Fuller 管理员 发表于 2020-2-9 16:19:57 | 只看该作者
上海垃圾分类 发表于 2020-2-9 16:14
请问怎么采集微博中,某一条微博,底下的评论?

可以加入集搜客qq群,那里讨论很热闹。有好几个集搜客qq群,比如这个:676198154
举报 使用道具
1013#
上海垃圾分类 初级会员 发表于 2020-2-11 15:21:53 | 只看该作者
Fuller 发表于 2020-2-9 16:18
把那条微博的网址拿到,添加到采集评论的工具中,选择只采评论

https://www.gooseeker.com/land/weibo.h ...

好的谢谢
举报 使用道具
1014#
Fuller 管理员 发表于 2020-2-11 15:45:45 | 只看该作者

这会正在升级成V9.0.5,这个版本解决了采集微博评论的一个bug。以前版本,如果采集微博评论过程中遇到微博显示“没有更多评论了”,会造成爬虫软件挂起很久。V9.0.5解决了这个问题
举报 使用道具
1015#
519848657 新手上路 发表于 2020-2-12 15:20:48 | 只看该作者
阅读数,讨论数都是0,粉丝数也没有
举报 使用道具
1016#
Fuller 管理员 发表于 2020-2-12 16:00:19 | 只看该作者
519848657 发表于 2020-2-12 15:20
阅读数,讨论数都是0,粉丝数也没有

关键词搜索吗?阅读数、评论数和粉丝数这些数字都是后加载的,如果网络速度慢,或者微博网站慢都会影响到抓取。全部都没有抓到吗?
举报 使用道具
1017#
Jane243 中级会员 发表于 2020-2-17 12:01:37 | 只看该作者
两个打数机只有一个在采集,另一个一直显示等待分配采集任务?
举报 使用道具
1018#
Fuller 管理员 发表于 2020-2-17 12:03:07 | 只看该作者
Jane243 发表于 2020-2-17 12:01
两个打数机只有一个在采集,另一个一直显示等待分配采集任务?

另一个也不要关闭,是在持续不断地将采下来的数据转换成excel。如果这个关闭了,只能等到那个采集窗口最后做一次转换,增加了失败的可能
举报 使用道具
1019#
Fuller 管理员 发表于 2020-2-17 12:04:12 | 只看该作者
采集数据的那个DS打数机窗口不要缩小,尽量最大化,不能最小化,如果还要做其他事情,这个窗口上可以覆盖其他窗口,就是不能缩小。微博这种动态网站,一旦窗口小到一定程度,就不显示网页内容了
举报 使用道具
1020#
Jane243 中级会员 发表于 2020-2-17 12:26:15 | 只看该作者
好的,谢谢了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-1 06:00