周期性网页抓取是网页抓取/数据抽取软件工具DataScraper从V4版本开始提供的功能特性,如果DataScraper需要周期性抓取属于多个主题的网页,网页抓取任务被分成多个组,每组负责多个相关的主题的网页抓取,而且调度参数(例如,周期,延迟时间等)一致,每个分组就是一个周期性网页抓取会话,在周期性网页抓取调度文件中,用一个thread块表示,MetaSeeker系统为每个会话启动专门的DataScraper线程。一个周期性网页抓取会话一般执行一些列网页抓取和数据抽取操作步骤,而且这些步骤有先后关系。