总共分为1、2、3级采集,若某一个2级下没有3级信息,那么这个2级的信息采集不到吗
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-9-8 17:22

沙发
Fuller 管理员 发表于 2016-9-8 17:22:21 | 只看该作者
不要求所有都是3级,可长可短

另外要注意:层级采集和连续动作采集是不一样的。

层级采集用在每一级都有各自的网址,所以每级之间没有很大的约束关系,上一级为下级采集好网址以后就不管了,下级什么时候运行可以自由安排。

如果采用连续动作逐级点进去,那么是一口气采集完的,我们称为连贯抓取。这样的话,三级都在当前窗口中运行,不能并行采集。如果遇到某一级是在弹出的窗口中显示,那么还得采用飞掠模式
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 22:21