1401#
fishhaichun 高级会员 发表于 2022-12-15 10:55:41 | 只看该作者
以前微博博主主页采集是可以选全部采集还是采集首页的,现在感觉没有选项了,采集不了特定博主所有的博文啊
举报 使用道具
1402#
fishhaichun 高级会员 发表于 2022-12-15 11:51:40 | 只看该作者
还有一个问题,在数据管家的浏览器下,微博自动跳转到新版了,而且没有了跳回旧版的设定,不是不微博又改版了啊,有什么解决办法吗
举报 使用道具
1403#
fishhaichun 高级会员 发表于 2022-12-15 11:51:40 | 只看该作者
还有一个问题,在数据管家的浏览器下,微博自动跳转到新版了,而且没有了跳回旧版的设定,不是不微博又改版了啊,有什么解决办法吗
举报 使用道具
1404#
Fuller 管理员 发表于 2022-12-15 12:26:26 | 只看该作者
fishhaichun 发表于 2022-12-15 11:51
还有一个问题,在数据管家的浏览器下,微博自动跳转到新版了,而且没有了跳回旧版的设定,不是不微博又改版 ...

这个星期一直在升级微博工具箱中的工具,因为跳回旧版的设定没有了。如果你的微博账号一直用旧版微博,那么看到的微博还是旧版。如果你的微博账号已经改成新版了,再也跳不会旧版了。所以,微博工具箱中的工具都增加了采集新版微博的功能。你的微博如果是新版的,照常往工具箱里添加网址和关键词就行了。只是这周还在调试中,导出数据可能有些影响,但是不影响采集,可以先采集着
举报 使用道具
1405#
Fuller 管理员 发表于 2022-12-15 12:29:19 | 只看该作者
fishhaichun 发表于 2022-12-15 10:55
以前微博博主主页采集是可以选全部采集还是采集首页的,现在感觉没有选项了,采集不了特定博主所有的博文啊 ...

博主主页采集不分那些种类了,因为微博网页变成了瀑布流的方式。只能从最开始启动采集,没有翻页,一直往下滚动。

假设一个用户有很多微博,你想从过去某个月份的开始采集,你在微博页面上找到这个月份的网址(在博主主要左上部有选择月份的功能,选择以后就得到了网址),加入到采集任务中。采集就会从那个月份开始。

但是,没有翻页,所以,采集一段时间以后,会发现不但采集了那个月份的,也采集了其他月份的。这时候,就要手工及时中断采集
举报 使用道具
1406#
fishhaichun 高级会员 发表于 2022-12-15 13:09:08 | 只看该作者
Fuller 发表于 2022-12-15 12:26
这个星期一直在升级微博工具箱中的工具,因为跳回旧版的设定没有了。如果你的微博账号一直用旧版微博,那 ...

谢谢您这么快就答复。我实际使用的感觉就是没有任何操作旧版忽然变新版了,应该是跳不回来了。我试试用新版采集吧
举报 使用道具
1407#
salut123 新手上路 发表于 2023-1-4 17:18:48 | 只看该作者
微博关键词搜索结果采集工具采集不完整怎么回事,就部分很长的文章都是展开c这样子,后面都没有了
举报 使用道具
1408#
Fuller 管理员 发表于 2023-1-4 17:49:11 | 只看该作者
salut123 发表于 2023-1-4 17:18
微博关键词搜索结果采集工具采集不完整怎么回事,就部分很长的文章都是展开c这样子,后面都没有了
...

搜索结果采集得到的数据就是这样的。针对需要展开的数据,应该做如下步骤的操作:
1. 利用excel的搜索功能,在搜索结果表中把含有展开c字样的微博都找出来
2. 把这些微博的网址整批添加到这个快捷采集工具:https://www.gooseeker.com/res/rule_494.html
举报 使用道具
1409#
kimq0428 新手上路 发表于 2023-1-23 17:46:06 | 只看该作者
采集出来的数据是按照粉丝数量排序的,有没有办法按照关注时间排序抓取呢?
举报 使用道具
1410#
Fuller 管理员 发表于 2023-1-24 10:25:26 | 只看该作者
kimq0428 发表于 2023-1-23 17:46
采集出来的数据是按照粉丝数量排序的,有没有办法按照关注时间排序抓取呢? ...

没有办法选择排序,而且能采集到的粉丝很少,因为微博限制了可看的粉丝数量
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-1 08:23