aicici 初级会员 发表于 2021-9-30 10:48:18 | 显示全部楼层
Fuller 发表于 2021-9-25 08:51
采集之前登录微博没有? 把你要采集的网址发给我试试

按照指示登录了微博了的,采集地址是:https://weibo.com/p/100808e1cf1a9614404b6306213211856249d8/super_index
举报 使用道具
gz51837844 管理员 发表于 2021-9-30 11:18:39 | 显示全部楼层

你是采集博文吗? 我打开你发的这个网址查看, 一共是23页, 总共也就几百条
QQ截图20210930111728.png
举报 使用道具
aicici 初级会员 发表于 2021-10-2 09:42:44 | 显示全部楼层
gz51837844 发表于 2021-9-30 11:18
你是采集博文吗? 我打开你发的这个网址查看, 一共是23页, 总共也就几百条

...

是的,那请问如果想要采集一个超话里的所有帖子,应该怎么操作呢,因为是进入超话的那个网址链接,没想到是不全的
举报 使用道具
Fuller 管理员 发表于 2021-10-2 10:08:40 | 显示全部楼层
aicici 发表于 2021-10-2 09:42
是的,那请问如果想要采集一个超话里的所有帖子,应该怎么操作呢,因为是进入超话的那个网址链接,没想到 ...

微博翻页数量是有限制的,采集不到那么多。可以用关键词搜索采集,这个限制少
举报 使用道具
aicici 初级会员 发表于 2021-10-2 10:46:12 | 显示全部楼层
Fuller 发表于 2021-10-2 10:08
微博翻页数量是有限制的,采集不到那么多。可以用关键词搜索采集,这个限制少
...

好的
举报 使用道具
h1yaokaixin 新手上路 发表于 2021-10-20 08:28:37 | 显示全部楼层
你好厉害,回复的好耐心呀。
举报 使用道具
linsay 初级会员 发表于 2021-11-1 12:09:58 | 显示全部楼层
b站采集出来的评论和回复都是重复的,等于是花钱下了一堆重复数据……能解决吗
举报 使用道具
gz51837844 管理员 发表于 2021-11-1 12:22:03 | 显示全部楼层
linsay 发表于 2021-11-1 12:09
b站采集出来的评论和回复都是重复的,等于是花钱下了一堆重复数据……能解决吗 ...

你使用的是这个快捷采集工具吗:B站视频采集_评论和回复
你把添加的链接发出来我们下午测试下
举报 使用道具
wangyong 版主 发表于 2021-11-1 14:31:34 | 显示全部楼层
linsay 发表于 2021-11-1 12:09
b站采集出来的评论和回复都是重复的,等于是花钱下了一堆重复数据……能解决吗 ...

多花了多少积分,这次重复了的可以先返还给你
举报 使用道具
momo228 初级会员 发表于 2021-11-3 16:20:03 | 显示全部楼层
推特的快捷采集能限制时间段吗
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 23:23