|
有些我们要采集的网页,需要先“动作”之后才能够显示我们要采集的内容
比如说:
场景一:中国知网输入主题的关键词,选择文献类型,点击搜索按钮,然后搜索结果就显示出来了。
这里的动作先后经过了:输入>选择>点击,我们看到该网页动作前后的网址并没有发生变化。
如果网址发生了变化,我们直接把网址导入MS谋数台直接定义规则就行了。
正是由于网址没有发生变化,将该网址导入MS谋数台之后,显示的页面还是未搜索之前的,所以我们就要让爬虫来做这一系列的动作后并且采集。
于是集搜客网络爬虫的“连续动作”就派上用场了。
参看教程:《连续动作让爬虫持续采集数据》 |
|
共 2 个关于本帖的回复 最后回复于 2016-12-21 16:07