集搜客GooSeeker网络爬虫

标题: 使用微博采集工具箱想采集有关' 武汉加油',尽量多的微博数据,如何实现? [打印本页]

作者: 月球漫步    时间: 2020-2-26 17:23
标题: 使用微博采集工具箱想采集有关' 武汉加油',尽量多的微博数据,如何实现?
本帖最后由 wangyong 于 2020-2-28 18:10 编辑

想采集有关' 武汉加油',尽量多的博文,如何实现?

作者: Fuller    时间: 2020-2-26 17:33
想通过微博关键词搜索采集数据吗?那就用这个微博采集工具:https://www.gooseeker.com/res/softdetail_4.html

这个关键词很热,应该把时间段切细
作者: 月球漫步    时间: 2020-2-26 17:54
可以到微博官网上,查看具体情况,按时间分,最短到小时;还可再按省,按城市细分,这个根据自己的需要去选择,把细分后对应的网址添加到这里采集http://gooseeker.com/res/softdetail_4.html
[attach]11873[/attach]


作者: Fuller    时间: 2020-2-26 18:02
月球漫步 发表于 2020-2-26 17:54
可以到微博官网上,查看具体情况,按时间分,最短到小时;还可再按省,按城市细分,这个根据自己的需要去选 ...

【新版本不是这样了,看下一贴】
你贴出来的这个微博采集工具是输入关键词的,时间段最小细分是1小时,如果还超出了,而且想用微博的高级搜索选项,那么应该把网址添加到这个快捷采集工具中:微博关键词搜索结果采集 。这个是快捷采集的,不是你说的那个微博采集工具箱的。他们是有区别的。下图蓝框是工具箱的,红框是快捷采集的


[attach]11874[/attach]




作者: Fuller    时间: 2020-2-26 18:51
Fuller 发表于 2020-2-26 18:02
你贴出来的这个微博采集工具是输入关键词的,时间段最小细分是1小时,如果还超出了,而且想用微博的高级 ...

纠正一下我的上一个帖子,现在集搜客微博采集工具箱升级了,在关键词搜索采集工具中已经加上了微博高级搜索的所有选项,参看下面的截图

[attach]11875[/attach]

作者: 月球漫步    时间: 2020-2-27 09:17
Fuller 发表于 2020-2-26 18:02
【新版本不是这样了,看下一贴】
你贴出来的这个微博采集工具是输入关键词的,时间段最小细分是1小时,如 ...

谢谢版主回复,仔细看了下工具箱和快捷采集 关于微博关键词搜索结果的采集的区别了
1、工具箱的采集,可以直接在里面选择细分条件,不用去微博官网复制网址了。
2、快捷采集,是把微博官网找好的要采集的网址,复制添加进去采集。

作者: 月球漫步    时间: 2020-2-27 09:19
wangyong 发表于 2020-2-26 18:57
最新版的微博关键词搜索工具,将微博搜索中的所有高级搜索条件都移植到了微博关键词搜索工具中

也就是在 ...

这个细分的搜索条件很详细,思路清晰很多了,感谢!

作者: Fuller    时间: 2020-2-27 09:26
月球漫步 发表于 2020-2-27 09:17
谢谢版主回复,仔细看了下工具箱和快捷采集 关于微博关键词搜索结果的采集的区别了
1、工具箱的采集,可 ...

微博采集工具箱和快捷采集的区别,这样对比就很清楚了
作者: wangyong    时间: 2020-4-26 18:58
Fuller 发表于 2020-2-26 18:02
你贴出来的这个微博采集工具是输入关键词的,时间段最小细分是1小时,如果还超出了,而且想用微博的高级 ...

最新版的微博关键词搜索工具,使用与微博网站里完全一致的高级搜索条件,把微博网站搜索中的所有高级搜索条件都移植了过来。

即,在微博关键词搜索工具中添加关键词任务时,可以在高级设置中选择最细分的条件,

比如,以上面提到的“武汉加油”为例,这是一个热词,相关的微博数据数量很大,但是一个搜索条件最多只能显示前五十页的内容,这样就需要要切分搜索条件,来得到更多数据

1楼提到了细分时间段,现在可以在细分时间段的基础上,继续按地区细分

步骤为:
1,点击细分按钮
2,选择按小时细分
3,选择按所有地区细分
完成这个设置后,生成多个搜索条件,也就是每个城市下每小时的搜索条件
[attach]12364[/attach]

会生成如下链接:https://s.weibo.com/weibo/%25E5%258F%25B8%25E6%25B3%2595%25E9%2583%25A8%25E5%259B%259E%25E5%25BA%2594%25E7%259B%2591%25E7%258B%25B1%25E7%2596%25AB%25E6%2583%2585%25E6%2583%2585%25E5%2586%25B5?q=%E6%96%B0%E5%86%A0%E8%82%BA%E7%82%8E®ion=custom:44:3&typeall=1&suball=1×cope=custom:2020-02-26-13:2020-02-26-14&Refer=g

[attach]12365[/attach]


作者: Fuller    时间: 2020-4-27 10:24
采集功能又升级了,采集微博的爬虫管理能力加强了




欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2