GooSeeker集搜客网络爬虫,简单高效的网页采集器

资源介绍

集微库 - 微博关键词搜索结果采集工具

  • 两步开启采集,小白轻松上手不需要掌握复杂的爬虫技术,添加采集任务点击“待启动”按钮后,只需两步就能够开启采集。
  • 定义发布时间,所见即可抓取 采集含有关键词和定义发布时间内的所有博文内容,所见数据收入囊中。
  • 工具嵌套使用,数据细致详尽 与其他微博采集工具嵌套使用,数据可覆盖整条传播途径。
  • 数据一键下载,支持按需导出 采集到的数据可以按需导出,下载到本地为Excel格式。
常见问题

温馨提示
为了避免在采集过程中遇到验证码的情况,该工具只翻页抓取31页;如果你采集的微博数据超过31页,可以通过设置微博“发布时间”段来解决(前提要确保该时间段内采集页数少于31页)。
数据截图
[]

用户评论

评分:

  1. xandy 2016-03-01 11:00

    在使用过程中有问题可以在本帖留言~~~{:2_31:}

  2. ml1691221 2016-03-01 11:34

    我想问两个问题: 1.数据的采集开始必须输出URL和对应的博主名称吗?我只有URL的话怎么处理?而且我想爬取2000多个用户,总不能一个个输入吧。。 2.在采集过程中,我看打数机是一直在进行数据个人用户爬取。。如果我要设定抓取一个用户200条微博或者我想爬取固定时间段的微博内容,我该怎样实习?

  3. xandy 2016-03-01 11:44

    你好, 1. 目前的博主采集工具是第一版本,第二版本我们将加入批量导入url的功能。 2. 关于限定页数和定时采集的功能,这个后续我们根据用户的反馈来进行功能改进。

  4. xionghexiang 2016-03-01 12:52

    那后续版本大约什么时间出现?此外,我添加任务后,马上显示停止,未抓取成功,这个如何解决?本人小白,非常感谢!

  5. xandy 2016-03-01 14:20

    后续版本近期就会上线,在社区的和官方QQ群我们实时通知的; 未抓取成功,你针对常见问题检查下步骤是否出错,最开始网址就不能添加错了,必须是博主主页的网址链接。

V8.9 版权所有 © 2007-2016 GooSeeker 深圳市天据电子商务有限公司
粤ICP备11065265号-2 粤公网安备 44030502000239号