如题
需求:
样本线索为:http://anlaosun.spdl.com/
我需要在: http://anlaosun.spdl.com/linkus.html 页面下采集信息
目前情况是:
在样本网址http://anlaosun.spdl.com/下点击“联系我们”可以获得/linkus.htm后缀
我以抓取线索的形式获得了在列表页面采集到http://anlaosun.spdl.com(线索一)
以线索一为样本页面采集到http://anlaosun.spdl.com/linkus.html(线索二)
在线索二页面下采集信息
不影响我爬取数据、但效率太低,需要采集两次线索(运行三次规则)
疑问:
是否可以在第一次采集获得的线索后直接加上后缀/linkus.html。可以省去一个规则
|
|
|
|
|
共 2 个关于本帖的回复 最后回复于 2017-1-23 17:34