要么采集停止时采集不全,要么就是显示停止,抓取失败(超时),
“出现抓取规则不合适或者超时时间设置太短“      ”检查iframe链失败,可能需要调高超时时长 ”等错误
这怎么解决那
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2020-10-22 12:18

沙发
Fuller 管理员 发表于 2020-10-22 08:56:14 | 只看该作者
微博评论和回复的采集过程很容易中断,因为微博评论可能很多,翻页过程中网络不稳定就中断了,而且微博有删评论的现象,很可能显示出来的数量和实际能看到的数量相差很远。

如果是采集中断的情况,多采集几遍,导出翻页最多的那一次。另外,要确保网络速度比较高。很多公用网络速度不行
举报 使用道具
板凳
zhangchy27 新手上路 发表于 2020-10-22 10:10:34 | 只看该作者
Fuller 发表于 2020-10-22 08:56
微博评论和回复的采集过程很容易中断,因为微博评论可能很多,翻页过程中网络不稳定就中断了,而且微博有删 ...

就是要多试几次?
举报 使用道具
地板
Fuller 管理员 发表于 2020-10-22 12:18:24 | 只看该作者
zhangchy27 发表于 2020-10-22 10:10
就是要多试几次?

你要采集的网址发出来,我们测试一下试试。

另外,根据你的帖子,我推断你是用集搜客数据管家采集微博,没有用集搜客网络爬虫软件,是不是这样的?我也要用一样的软件做测试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 15:03