你好,我在第一页上抓取到80多个URL,然后进行第二层级抓取,
第二层级其实我只要专区三个数据,这三个数据都是在页面比较顶部的地方,
但是由于页面一直往下拉有很长的距离,导致单个页面抓取时间很长
如何设置,抓完我眼的数据,就马上进入下一页,节省时间呢?
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-11-27 20:49

沙发
Fuller 管理员 发表于 2016-11-27 20:41:49 | 只看该作者
滚屏参数不要设置。
1)如果是 单搜或者集搜,滚屏参数是在DS打数机菜单上设置的,菜单 配置-〉滚屏参数,把滚屏次数设置为0
2)如果是爬虫群模式,要到会员中心-〉规则管理,找到这个规则,点击后进入管理页面,点击“调度”,调度参数也有滚屏次数
举报 使用道具
板凳
yiyuyiyi 初级会员 发表于 2016-11-27 20:45:10 | 只看该作者
Fuller 发表于 2016-11-27 20:41
滚屏参数不要设置。
1)如果是 单搜或者集搜,滚屏参数是在DS打数机菜单上设置的,菜单 配置-〉滚屏参数, ...

我需要的三个数,不一定单屏就拿到,可能需要滚动几屏的,也是设为0吗?
举报 使用道具
地板
Fuller 管理员 发表于 2016-11-27 20:49:12 | 只看该作者
yiyuyiyi 发表于 2016-11-27 20:45
我需要的三个数,不一定单屏就拿到,可能需要滚动几屏的,也是设为0吗?
...

滚屏次数设置1,不是严格滚1屏的,但是,这个数量小,会更省时间,另外,如果网速很快,滚屏速度设置成4,5,6,越大越快
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 09:05