1191#
Fuller 管理员 发表于 2020-12-6 22:28:44 | 只看该作者
求知的蜗牛 发表于 2020-12-6 15:50
请问已经点了启动采集,但在采集的过程中,采集中,右边的个人信息里一直显示待启动;采集完后打包也是空的 ...

从后台看,你这个账号并没有采集过微博数据,我估计你在爬虫软件客户端登录了另外一个账号。而在会员中心登录了当前这个账号。那么爬虫软件就拿不到任务。

下载最新版的增强版爬虫软件,会提示账号不一致,并且会自动同步账号登录状态,下载网址:https://www.gooseeker.com/pro/gooseeker.html
举报 使用道具
1192#
15216043601 新手上路 发表于 2020-12-7 10:00:36 | 只看该作者
Fuller 发表于 2020-12-6 22:28
从后台看,你这个账号并没有采集过微博数据,我估计你在爬虫软件客户端登录了另外一个账号。而在会员中心 ...

我下载的就是最新版本的,左下角也确实是当前的账号,会员中心这些地方也点进去看过了,都是同一个账号
举报 使用道具
1193#
Ly20201109 初级会员 发表于 2020-12-18 20:06:51 | 只看该作者
你好,数据采集完成之后为什么无法打包下载呢?
举报 使用道具
1194#
Fuller 管理员 发表于 2020-12-18 20:49:22 | 只看该作者
Ly20201109 发表于 2020-12-18 20:06
你好,数据采集完成之后为什么无法打包下载呢?

有什么提示?打包没有数据?看看页面图像下面的数据下载。是不是已经打包了。
举报 使用道具
1195#
Ly20201109 初级会员 发表于 2020-12-19 11:13:40 | 只看该作者
好的谢谢,请问为什么采集到的评论和转发是不全的呢?需要手动翻页未展开的内容吗?
举报 使用道具
1196#
Fuller 管理员 发表于 2020-12-19 11:26:34 | 只看该作者
Ly20201109 发表于 2020-12-19 11:13
好的谢谢,请问为什么采集到的评论和转发是不全的呢?需要手动翻页未展开的内容吗? ...

评论和转发容易中断,如果要采集评论里面的回复,要用另一个快捷采集:https://www.gooseeker.com/res/datadiy.html?category=热门网站&web=新浪微博&rule=微博评论和回复采集

另外,如果使用老版的集搜客网络爬虫,能过滤掉重复数据,如果使用新版的集搜客数据管家,能过滤重复数据的版本要等下星期发布,V10.1.0
举报 使用道具
1197#
chen1996jh 初级会员 发表于 2020-12-25 20:53:02 | 只看该作者
你好,请问使用微博博主主页采集工具怎么才能把长微博“展开全文”,以及如何可以吧博主主页微博的评论文本,评论人,转发内容,转发人信息采集下来,还请赐教,谢谢
举报 使用道具
1198#
wangyong 版主 发表于 2020-12-25 21:34:41 | 只看该作者
chen1996jh 发表于 2020-12-25 20:53
你好,请问使用微博博主主页采集工具怎么才能把长微博“展开全文”,以及如何可以吧博主主页微博的评论文本 ...

https://www.gooseeker.com/res/datadiy.html?category=%E7%83%AD%E9%97%A8%E7%BD%91%E7%AB%99&web=%E6%96%B0%E6%B5%AA%E5%BE%AE%E5%8D%9A&rule=%E5%BE%AE%E5%8D%9A%E5%8D%9A%E6%96%87%E5%B1%95%E5%BC%80%E5%85%A8%E9%83%A8%E9%87%87%E9%9B%86博主主页的采集结果中有博文独立网址这个字段,用Excel筛选博文字段,将包含“展开全文”的微博独立链接筛选出来,添加到快捷采集中微博展开全文的采集入口,就能成功采集到展开全文后的数据了。

微博评论和转发的数据在上图中也有标选,也是输入博文独立网址就可以采集,入口是:https://www.gooseeker.com/res/softdetail_6.html

举报 使用道具
1199#
ginowjj616 新手上路 发表于 2021-1-6 10:18:25 | 只看该作者
xandy 发表于 2016-3-1 11:00
在使用过程中有问题可以在本帖留言~~~

一直显示需要登录微博,登录了以后,点击继续的按钮点下去没反应
举报 使用道具
1200#
wangyong 版主 发表于 2021-1-6 10:20:35 | 只看该作者
ginowjj616 发表于 2021-1-6 10:18
一直显示需要登录微博,登录了以后,点击继续的按钮点下去没反应

新打开一个浏览器窗口,登录微博账号,这个窗口用来登录。

可以下载新版的数据管家来采集,更稳定:https://www.gooseeker.com/pro/gooseeker.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 08:21