641#
mwc118 新手上路 发表于 2018-4-11 00:40:45 | 只看该作者
请问能否采集特定博主微博内的关键词?谢谢
举报 使用道具
642#
maomao 论坛元老 发表于 2018-4-11 08:35:38 | 只看该作者
mwc118 发表于 2018-4-11 00:40
请问能否采集特定博主微博内的关键词?谢谢

你试一试博主主页内容工具,先在博主主页内搜索某个关键词,然后把网址和博主名称,输入这个工具,
举报 使用道具
643#
Fuller 管理员 发表于 2018-4-11 09:01:02 | 只看该作者
mwc118 发表于 2018-4-11 00:40
请问能否采集特定博主微博内的关键词?谢谢

用这个博主主页采集工具:https://www.gooseeker.com/res/softdetail_3.html

举个例子



假设要通过“爱”这个词分析一下王宝强的心理。那么在微博内搜索输入“爱”,点击搜索,记下来网址,把这个网址放入博主主页采集工具中,就能采集下来了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
644#
baixiaopang 中级会员 发表于 2018-4-12 17:39:51 | 只看该作者
微博主页采集采集一段时间就停止了,该怎么处理?
举报 使用道具
645#
cluetest21 初级会员 发表于 2018-4-12 18:12:05 | 只看该作者
baixiaopang 发表于 2018-4-12 17:39
微博主页采集采集一段时间就停止了,该怎么处理?

是哪个博主主页, 能否把链接发出来我们测试一下

举报 使用道具
646#
baixiaopang 中级会员 发表于 2018-4-12 18:33:42 | 只看该作者
cluetest21 发表于 2018-4-12 18:12
是哪个博主主页, 能否把链接发出来我们测试一下

我下载的几个企业的官方微博的,试了几个都是下载几条就停了。https://weibo.com/u/5132862451?is_ori=1&is_forward=1&is_text=1&is_pic=1&is_video=1&is_music=1&is_article=1&key_word=&start_time=2014-01-01&end_time=2015-01-13&is_search=1&is_searchadv=1#_0类似这个,我做了时间限制,但是三年的微博2000多条,大概要好几批。

举报 使用道具
647#
cluetest21 初级会员 发表于 2018-4-12 20:58:14 | 只看该作者
baixiaopang 发表于 2018-4-12 18:33
我下载的几个企业的官方微博的,试了几个都是下载几条就停了。https://weibo.com/u/5132862451?is_ori=1& ...

好的, 我们测试一下。
如果可以用网址里的参数来分多个时间段抓取,这样挺好的,因为即使断了,也可以从断点处接着爬

举报 使用道具
648#
baixiaopang 中级会员 发表于 2018-4-12 21:52:19 | 只看该作者
cluetest21 发表于 2018-4-12 20:58
好的, 我们测试一下。
如果可以用网址里的参数来分多个时间段抓取,这样挺好的,因为即使断了,也可以从 ...

嗯,麻烦了。现在可以找到断点连着抓取,但是就是觉得总是断,有点太麻烦了。
举报 使用道具
649#
之之 新手上路 发表于 2018-4-18 10:53:57 | 只看该作者
明明已经采集结束,但是还是显示采集中,有什么办法可以把前期的数据先导出来吗
举报 使用道具
650#
wangyong 版主 发表于 2018-4-18 11:20:29 | 只看该作者
采集中可能是采集失败了,是用的微博哪个工具加的什么链接
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-10 18:45