591#
gz51837844 管理员 发表于 2018-1-11 19:46:22 | 只看该作者
昨天发布的爬虫V8.5.0, 采集微博更稳定, 请到集搜客官网下载
举报 使用道具
592#
12345tia 新手上路 发表于 2018-1-12 16:48:29 | 只看该作者
不知道这个里面有没有可以设置抓取微博评论的起、止时间,因为有的评论想抓取一个时间段的,如果没有,想请教一下大神该该怎么抓取一个时间段的微博评论呢?
举报 使用道具
593#
数据集二期 中级会员 发表于 2018-1-12 17:46:08 | 只看该作者
12345tia 发表于 2018-1-12 16:48
不知道这个里面有没有可以设置抓取微博评论的起、止时间,因为有的评论想抓取一个时间段的,如果没有,想请 ...

微博评论不能直接通过时间筛选,可以把评论全部采集下来,在采集评论的时候把时间抓下来,然后在excel里筛选。
举报 使用道具
594#
disiye 新手上路 发表于 2018-1-14 20:12:05 | 只看该作者
采集状态是已采集 为什么无法打包 打包按钮是灰色的
举报 使用道具
595#
数据集 高级会员 发表于 2018-1-15 09:22:08 | 只看该作者
disiye 发表于 2018-1-14 20:12
采集状态是已采集 为什么无法打包 打包按钮是灰色的

采集完成后不要立即关闭采集窗口,如果数据量大的话,数据还在入库,所以需要等待一段时间等数据全部入库之后才能关闭采集窗口,再打包数据。
举报 使用道具
596#
cerulean 新手上路 发表于 2018-1-15 15:38:38 | 只看该作者
这个不能选爬取的页码和数量嘛?
举报 使用道具
597#
数据集 高级会员 发表于 2018-1-15 16:10:43 | 只看该作者
cerulean 发表于 2018-1-15 15:38
这个不能选爬取的页码和数量嘛?

微博工具的参数都是调整好的,暂时不支持主动选择爬取的数量,可以把需要采集的网页页码的独立网址加入到微博工具,把网址上的微博信息全部采集下来,再通过excel筛选出需要的数据。也可以自己制作规则,就可以通过爬虫群控制采集的页数和数量。

举报 使用道具
598#
cerulean 新手上路 发表于 2018-1-15 16:26:15 | 只看该作者
这样啊 ,因为有时候不需要那么多数据,可以还得全部爬下来,多花了一些积分……
举报 使用道具
599#
数据集 高级会员 发表于 2018-1-15 18:29:47 | 只看该作者
cerulean 发表于 2018-1-15 16:26
这样啊 ,因为有时候不需要那么多数据,可以还得全部爬下来,多花了一些积分…… ...

不会多很多,也可以自己制作采集规则。
举报 使用道具
600#
chinafree 新手上路 发表于 2018-1-25 01:54:41 | 只看该作者
第五页之后的数据怎么采?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 集搜客分词软件的选词矩阵在哪里下载?
  • 为什么用微软的excel无法打开xls文件?powe
  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法

热门用户

GMT+8, 2025-12-13 06:21