Fuller 管理员 发表于 2020-1-9 15:32:35 | 显示全部楼层
Zendralyn 发表于 2020-1-9 15:08
不管怎样都是未执行采集任务

我看到你的账号很久以前就注册了,以前使用正常吗?可以加入qq群 830157068 ,在那里有技术支持帮你解决一下
举报 使用道具
2108523618005 新手上路 发表于 2020-1-12 16:33:39 | 显示全部楼层
为什么同时爬取多个网页有许多网页评论信息根本加载不出来?
举报 使用道具
Fuller 管理员 发表于 2020-1-12 17:41:03 | 显示全部楼层
2108523618005 发表于 2020-1-12 16:33
为什么同时爬取多个网页有许多网页评论信息根本加载不出来?

同时运行了几个爬虫窗口?微博对网络速度和电脑性能要求挺高的,如果微博中又有大量图片和视频,就更慢了。一个微博往往有很多评论,只爬一个微博都要很长时间,一个一个地添加微博网址吧。
举报 使用道具
songsong627 初级会员 发表于 2020-1-13 19:50:50 | 显示全部楼层
请问微博主页内容的搜集,最近日期的微博为什么抓取不到呢?昨天试了只能得到2019年5月份的微博内容,不能抓取2019年整年的内容嘛?
举报 使用道具
Fuller 管理员 发表于 2020-1-13 21:11:56 | 显示全部楼层
songsong627 发表于 2020-1-13 19:50
请问微博主页内容的搜集,最近日期的微博为什么抓取不到呢?昨天试了只能得到2019年5月份的微博内容,不能 ...

你添加的网址是什么?

这个博主是不是有很多微博?如果太多,可以按年甚至按月分开添加网址
举报 使用道具
songsong627 初级会员 发表于 2020-1-13 22:24:55 | 显示全部楼层
Fuller 发表于 2020-1-13 21:11
你添加的网址是什么?

这个博主是不是有很多微博?如果太多,可以按年甚至按月分开添加网址

添加的网址就是微博主页,确实有很多微博,2012、3年的微博抓去了很多,可我需要的是2019年的。请问怎样按年添加网址呢?谢谢~

举报 使用道具
Fuller 管理员 发表于 2020-1-13 23:31:27 | 显示全部楼层
songsong627 发表于 2020-1-13 22:24
添加的网址就是微博主页,确实有很多微博,2012、3年的微博抓去了很多,可我需要的是2019年的。请问怎样 ...

在博主主页点“全部”,然后把链接添加到采集工具中。估计你没有点击全部,所以爬的都是热门
举报 使用道具
yexiaozhu 新手上路 发表于 2020-1-28 05:41:14 | 显示全部楼层
请问,采集评论应该输哪个url地址呢?现在没有单独的页面了
举报 使用道具
Fuller 管理员 发表于 2020-1-28 09:21:49 | 显示全部楼层
yexiaozhu 发表于 2020-1-28 05:41
请问,采集评论应该输哪个url地址呢?现在没有单独的页面了

weibo20200128-091824.png
点击这个位置,就能进入到每条微博的网页,这个网址是独立网址。如果你没有发现独立网址,可能你上的手机网站,是没有独立网址的。weibo.cn就是手机网站,应该上weibo.com
举报 使用道具
不日远游 初级会员 发表于 2020-2-1 13:28:53 | 显示全部楼层
怎么一直闪退???
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-18 19:31