1461#
17727541164 初级会员 发表于 2023-11-22 22:32:10 | 只看该作者
感恩。但是还需要地址的字段,希望快点可以上线
举报 使用道具
1462#
Fuller 管理员 发表于 2023-11-23 10:44:05 | 只看该作者
17727541164 发表于 2023-11-22 22:32
感恩。但是还需要地址的字段,希望快点可以上线

微博搜索结果页面上不显示地址,所以采集不了。需要你把搜索结果数据导出来以后,把每条微博的网址拷贝出来,批量加入这个快捷采集工具,采集一遍详情,就能采集到地址信息:https://www.gooseeker.com/res/rule_494.html
举报 使用道具
1463#
SHXX259 新手上路 发表于 2023-12-1 15:17:31 | 只看该作者
没有博主粉丝量这项数据了,非常难办。希望可以增加。
举报 使用道具
1464#
wangyong 版主 发表于 2023-12-1 16:15:41 | 只看该作者
SHXX259 发表于 2023-12-1 15:17
没有博主粉丝量这项数据了,非常难办。希望可以增加。

用的是哪个微博工具?
举报 使用道具
1465#
zhgaogaopa 初级会员 发表于 2024-1-5 02:13:17 | 只看该作者
把需要采集全文的网址整理出来,导入到这个快捷采集工具中:https://www.gooseeker.com/res/rule_494.html 您好,请问这个网址为什么显示是“404您访问的页面无法显示”,要如何把关键词微博的完整内容采集出来呢?
举报 使用道具
1466#
zhgaogaopa 初级会员 发表于 2024-1-5 02:17:39 | 只看该作者
另外,请问一下如果想用微博关键词采集5年的数据,分段时间粒度设置为多少比较好嘞?有没有建议?因为怕数据太多,采集时间太长,目前是想按30天设置,不知道合理吗?还是说一年一年采集,这样怕是数据更多
举报 使用道具
1467#
zhgaogaopa 初级会员 发表于 2024-1-5 02:20:13 | 只看该作者
另外想请教一下,如果用微博关键词采集5年的数据,分段时间粒度设置在多少比较合适呢?因为怕采集的时间才长,且如果数据太多后续清洗很麻烦,现在想设置在30天不知道合理吗?或者一年一年采集?这样数据是不是只会更多。。
举报 使用道具
1468#
zhgaogaopa 初级会员 发表于 2024-1-5 02:25:38 | 只看该作者
zhgaogaopa 发表于 2024-1-5 02:13
把需要采集全文的网址整理出来,导入到这个快捷采集工具中:https://www.gooseeker.com/res/rule_494.html  ...

另外想请教一下,如果用微博关键词采集5年的数据,分段时间粒度设置在多少比较合适呢?因为怕采集的时间才长,且如果数据太多后续清洗很麻烦,现在想设置在30天不知道合理吗?或者一年一年采集?这样数据是不是只会更多。。
举报 使用道具
1469#
Fuller 管理员 发表于 2024-1-5 09:27:06 | 只看该作者
zhgaogaopa 发表于 2024-1-5 02:25
另外想请教一下,如果用微博关键词采集5年的数据,分段时间粒度设置在多少比较合适呢?因为怕采集的时间 ...

如果想采集的尽量全,那就粒度设置尽量细。如果不想采集很多,就粒度大一些。具体多少,可以先调查一下,手工搜索和浏览一下,看看有多集中,再决定时间粒度
举报 使用道具
1470#
明镜翼 新手上路 发表于 2024-1-20 23:03:41 | 只看该作者
您好,昨天采集微博主页功能增加了时间限制后,有很多数据就采集不到了,转发的微博也不会显示转评赞等相关信息,请问要如何处理啊?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-2 20:57