1411#
wangyong 版主 发表于 2023-2-13 21:22:24 | 只看该作者
15623632309 发表于 2023-2-13 20:42
采集微博关键词失败,日志显示ValidateHtmlPage        抓取失败(超时),抓取规则不合适或者超时时间设置太短 ...

我们测试微博工具现在可以正常使用,你采集的时候将数据管家中的微博切换到新版了吗?
举报 使用道具
1412#
zhgaogaopa 初级会员 发表于 2023-2-16 21:15:17 | 只看该作者
微博关键词数据采集,任务状态是已停止,采集页面是结束状态,打包时候显示0条可打包是怎么回事呀?
举报 使用道具
1413#
Fuller 管理员 发表于 2023-2-16 23:32:17 | 只看该作者
zhgaogaopa 发表于 2023-2-16 21:15
微博关键词数据采集,任务状态是已停止,采集页面是结束状态,打包时候显示0条可打包是怎么回事呀? ...

在微博采集工具箱界面上的右上区域是账户信息,其中有个数据下载按钮,如果以前已经打包过数据,点击数据下载按钮可以把以前打包的数据下载下来。如果从来没有打包过,明天上班我们技术人员会检查一下数据库,帮你打包出来
举报 使用道具
1414#
TsukiKaede 新手上路 发表于 2023-2-18 22:29:34 | 只看该作者
试图采集关注者,但打开的还是粉丝页面,采集数据和粉丝无异。新版,采集粉丝是正确的。
举报 使用道具
1415#
ladymessi 新手上路 发表于 2023-2-26 17:09:43 | 只看该作者
单条微博评论采集,采集到的评论数很少有什么解决办法吗?
举报 使用道具
1416#
Fuller 管理员 发表于 2023-2-26 18:58:35 | 只看该作者
ladymessi 发表于 2023-2-26 17:09
单条微博评论采集,采集到的评论数很少有什么解决办法吗?

采集微博评论的时候,网络速度要有比较快才行,如果使用手机上网,采集不到多少条,最好是光纤上网。电脑不要安装360等安全卫士,这些软件会大大影响网络的稳定性。爬虫运行的时候不要缩小爬虫窗口,窗口越大,微博显示的内容越多。

如果网络和电脑条件比较好,一条微博能采集到1万条评论
举报 使用道具
1417#
zhgaogaopa 初级会员 发表于 2023-3-2 23:38:31 | 只看该作者
您好,请问采集显示有部分采集失败,我点击重采失败部分之后,任务状态从采集中变成了待启动,点击上方的【启动采集】登陆微博之后,点击【点击此处】没有反应是为什么嘞?我应该怎么才能重新启动这个任务呀
举报 使用道具
1418#
gz51837844 管理员 发表于 2023-3-3 10:34:49 | 只看该作者
zhgaogaopa 发表于 2023-3-2 23:38
您好,请问采集显示有部分采集失败,我点击重采失败部分之后,任务状态从采集中变成了待启动,点击上方的【 ...

你说的“没有反应“ 是指没有新弹开2个窗口? 还是窗口已经有了但是没有开始自动加载微博页面开始采集?
举报 使用道具
1419#
zhgaogaopa 初级会员 发表于 2023-3-4 14:27:38 | 只看该作者
gz51837844 发表于 2023-3-3 10:34
你说的“没有反应“ 是指没有新弹开2个窗口? 还是窗口已经有了但是没有开始自动加载微博页面开始采集?
...

没有新弹开两个窗口。在点【重新采集】之前,是有两个窗口一直在转,现在还在转,安全关闭关不掉,任务采集状态在重新采集之后已经变成【待采集】,最新十条数据也没有更新。
举报 使用道具
1420#
fan1119 初级会员 发表于 2023-3-6 10:32:20 | 只看该作者
什么时候可以按时间筛选采集数据啊
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-1 12:40