1031#
351351 新手上路 发表于 2020-2-23 13:12:20 | 只看该作者
Fuller 发表于 2020-2-23 13:10
你在用哪个微博采集工具?关键词搜索吗?

微博博主 主页内容,

举报 使用道具
1032#
Fuller 管理员 发表于 2020-2-23 13:15:38 | 只看该作者
微博关键词搜索有两个快捷采集,如下图,红框里面那个,需要输入要采集的网址,蓝框那个需要输入关键词,有高级设置条件,其中有起始和终止日期


举报 使用道具
1033#
351351 新手上路 发表于 2020-2-23 13:44:29 | 只看该作者
Fuller 发表于 2020-2-23 13:15
微博关键词搜索有两个快捷采集,如下图,红框里面那个,需要输入要采集的网址,蓝框那个需要输入关键词,有 ...

那如果要爬取某个账号一个月内的所有内容该怎么办
举报 使用道具
1034#
Fuller 管理员 发表于 2020-2-23 14:52:36 | 只看该作者
351351 发表于 2020-2-23 13:44
那如果要爬取某个账号一个月内的所有内容该怎么办

比如,下面这个微博,如果博文很多,会在右边有个选择条,选择好了以后,把地址栏中的新网址拷贝下来,放入 新浪微博博主主页 那个采集工具中:


举报 使用道具
1035#
351351 新手上路 发表于 2020-2-23 14:54:56 | 只看该作者
Fuller 发表于 2020-2-23 14:52
比如,下面这个微博,如果博文很多,会在右边有个选择条,选择好了以后,把地址栏中的新网址拷贝下来,放 ...

十分感谢


举报 使用道具
1036#
990906 新手上路 发表于 2020-2-27 09:36:34 | 只看该作者
我想知道,可以把微博的位置信息采集下来吗
举报 使用道具
1037#
Fuller 管理员 发表于 2020-2-27 10:14:49 | 只看该作者
990906 发表于 2020-2-27 09:36
我想知道,可以把微博的位置信息采集下来吗

采集微博的时候,如果博文中有地点名,会把这个名字采集下来。如果还需要这个地点对应的经纬度,需要到百度地图上去查
举报 使用道具
1038#
酵母酵母 新手上路 发表于 2020-2-29 00:41:51 | 只看该作者
你好!我在采集时候只能采到微博未登录页面的第一页,我总是登录不上去,不知道是采集的太快还是什么,连密码都没输完就采集完毕了,然后浏览器页面就再也加载不出来了,导致一直只能采集到第一页的tag信息,请太太指教!!!
举报 使用道具
1039#
Fuller 管理员 发表于 2020-2-29 08:10:23 | 只看该作者
酵母酵母 发表于 2020-2-29 00:41
你好!我在采集时候只能采到微博未登录页面的第一页,我总是登录不上去,不知道是采集的太快还是什么,连密 ...

不是在爬虫都运行起来才登录,而是预先登录。就是把集搜客爬虫软件运行起来以后,你看到的是一个浏览器的样子,这时候访问微博,手工做登录。这个都准备好了,再运行起来DS打数机爬数据
举报 使用道具
1040#
酵母酵母 新手上路 发表于 2020-2-29 14:25:02 | 只看该作者
Fuller 发表于 2020-2-29 08:10
不是在爬虫都运行起来才登录,而是预先登录。就是把集搜客爬虫软件运行起来以后,你看到的是一个浏览器的 ...

谢谢!已经解决了!
但是两万多条的转发我只抓到了一半TwT
是因为我不是氪金用户吗

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-5 17:30