11#
Fuller 管理员 发表于 2017-4-10 22:03:44 | 只看该作者
toby3003 发表于 2017-4-10 21:40
你好,十分感谢你的回复,我今天又用PM2.5那个页面制作了规则,现在就能够抓取了。
开始我认为SO2和PM2.5 ...

这一套规则没有办法加快速度,因为只有一条线索,如果是多条线索,可以放在多个爬虫群窗口中执行,但是你只有一条线索。

但是有一种方法:做成多套规则,每套规则下拉菜单选择的不一样。只要设置成不同的起点,同时把跨度设置上,就能分别抓。比如,跨度是3,那么一个主题的起点是1,另一个是2,第三个是3,那么他们就会从不同起点开始跳着抓。
举报 使用道具
12#
toby3003 初级会员 发表于 2017-4-11 03:39:45 | 只看该作者
Fuller 发表于 2017-4-10 22:03
这一套规则没有办法加快速度,因为只有一条线索,如果是多条线索,可以放在多个爬虫群窗口中执行,但是你 ...

谢谢你的回复,很好的技巧,值得学习。
您说的做成多套规律是指在连续动作的那一层里面添加的规律,还是在第二层中添加的规律?
谢谢你
举报 使用道具
13#
Fuller 管理员 发表于 2017-4-11 09:14:29 | 只看该作者
toby3003 发表于 2017-4-11 03:39
谢谢你的回复,很好的技巧,值得学习。
您说的做成多套规律是指在连续动作的那一层里面添加的规律,还是 ...

在第一层的动作那里
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简
  • 聚类分析和主题分析中的特征选择参数的设置

热门用户

GMT+8, 2026-3-26 03:43