我在爬翻页的时候有13页  为什么每次到第三页就失败了
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2016-11-1 17:25

沙发
scraper 论坛元老 发表于 2016-11-1 17:19:28 | 只看该作者
DS下方的日志窗口有报错吗
举报 使用道具
板凳
钮祜禄嘉 新手上路 发表于 2016-11-1 17:20:40 | 只看该作者
scraper 发表于 2016-11-1 17:19
DS下方的日志窗口有报错吗

没,但是我的网页加载比较慢


这种页面  table tr 一个个加载


举报 使用道具
地板
scraper 论坛元老 发表于 2016-11-1 17:21:13 | 只看该作者
钮祜禄嘉 发表于 2016-11-1 17:20
没,但是我的网页加载比较慢

那可能是没有加载到翻页标志 然后就认为没有翻页了
举报 使用道具
5#
钮祜禄嘉 新手上路 发表于 2016-11-1 17:21:53 | 只看该作者
比较慢
这一页 只抓取了 4条数据
提示验证规则失败
这跟我们网页加载慢有关系吗
不是等网页全部加载完成再爬吗?
举报 使用道具
6#
scraper 论坛元老 发表于 2016-11-1 17:22:15 | 只看该作者
钮祜禄嘉 发表于 2016-11-1 17:21
比较慢
这一页 只抓取了 4条数据
提示验证规则失败

没加载到翻页标志 就认为不用翻页
举报 使用道具
7#
钮祜禄嘉 新手上路 发表于 2016-11-1 17:22:40 | 只看该作者
本帖最后由 钮祜禄嘉 于 2016-11-1 17:23 编辑

有翻页标志 只是加载很慢

我这个网页比较慢
举报 使用道具
8#
scraper 论坛元老 发表于 2016-11-1 17:24:20 | 只看该作者
钮祜禄嘉 发表于 2016-11-1 17:22
有翻页标志 只是加载很慢

我这个网页比较慢

到了超时时间没加载出来
就认为没有
举报 使用道具
9#
钮祜禄嘉 新手上路 发表于 2016-11-1 17:24:35 | 只看该作者
scraper 发表于 2016-11-1 17:24
到了超时时间没加载出来
就认为没有

这样啊
举报 使用道具
10#
scraper 论坛元老 发表于 2016-11-1 17:25:07 | 只看该作者

调整一下滚屏参数,让采集速度慢点
还可以把超时时长调长一点

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 20:23