总共分为1、2、3级采集,若某一个2级下没有3级信息,那么这个2级的信息采集不到吗
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-9-8 17:22

沙发
Fuller 管理员 发表于 2016-9-8 17:22:21 | 只看该作者
不要求所有都是3级,可长可短

另外要注意:层级采集和连续动作采集是不一样的。

层级采集用在每一级都有各自的网址,所以每级之间没有很大的约束关系,上一级为下级采集好网址以后就不管了,下级什么时候运行可以自由安排。

如果采用连续动作逐级点进去,那么是一口气采集完的,我们称为连贯抓取。这样的话,三级都在当前窗口中运行,不能并行采集。如果遇到某一级是在弹出的窗口中显示,那么还得采用飞掠模式
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简
  • 聚类分析和主题分析中的特征选择参数的设置
  • 为集搜客分词和情感分析扩展模块安装情感分

热门用户

GMT+8, 2026-3-11 06:29