如何重新激活一个主题的抓取

我定义了一个二级抓取,第1级抓取没有问题,第二级抓取因为存在某些页面结构有变化而在抓取时没有抓到,我重新定义了二级抓取的信息结构,需要重新进行第二级的抓取,要怎么重新开始呢?
还有由于抓取的量比较大,一次抓取时间比较长,可以暂停吗?

有多种方法激活一个主题的抓取

如果一个主题的抓取执行完了,需要再次激活,有多种方法:

1,如果是第二级需要重新激活,则只需要再次抓取第一级,但是需要注意一点,如果采用周期性自动抓取方式,在周期性网页抓取调度文件crontab.xml中,将updateClue参数设置成true,否则,是增量抓取模式,以前抓取过的线索不再被激活。参见:http://www.gooseeker.com/cn/node/technology/files/pss

2,如果一个主题下只有一个线索,需要激活,则用MetaStudio加载这个信息结构,加载成功后点击工具条的Instruction或者Schema按钮,能够重新激活

3,使用周期性自动抓取方式,在crontab.xml文件中配置renewClue这一步,能够将某个主题下的所有线索激活。

虽然没有暂停功能,但是,直接将DataScraper关掉即可,顶多会损失当前正在抓取的这个网页。