意思是,比如我要采集三层的数据,第一层是链接,第二层是链接,第三层是内容,就要建立三个主题,在DS打数机中需要先采集第一层,第一层采集完后才能手动的采集第二层,以及后面的第三层,我想问的是能不能判定一下第一层采集完后自动采集第二层,第二层采集完后自动采集第三层呢?
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2015-9-12 15:44

gz51837844 管理员 发表于 2015-9-12 12:05:18 | 显示全部楼层
可以的,可以把3层的采集主题名都配置到crontab.xml里, 这样每一级采集主题在有新的线索生成后,都会自动开始抓取。
关于周期性抓取配置,请看这篇文章 http://www.gooseeker.com/cn/node/technology/files/pss
举报 使用道具
huang2891526 新手上路 发表于 2015-9-12 13:41:18 | 显示全部楼层
gz51837844 发表于 2015-9-12 12:05
可以的,可以把3层的采集主题名都配置到crontab.xml里, 这样每一级采集主题在有新的线索生成后,都会自动开 ...

这个有点儿难,我没有看懂!
举报 使用道具
gooseeker_info 金牌会员 发表于 2015-9-12 15:44:25 | 显示全部楼层
huang2891526 发表于 2015-9-12 13:41
这个有点儿难,我没有看懂!!!!

生成crontab.xml的工具:http://www.gooseeker.com/res/tooldetail_4.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-17 02:26