|
我测试了你的第一级和第二级,运行正常。至于怎样才能更有效地做规则,而不用把网址考来考去,建议使用GS浏览器的定义规则功能。第一步:在gs浏览器上加载第一级的样本页面
第二步:在GS浏览器的工具条的中间有个选择框“定义规则”,选择以后进入定义规则模式。定义完成第一级以后,存规则
第三步:再次点击工具条中间的选择框,此时已经变成了“普通浏览”,点击以后,进入浏览模式,输入搜索条件,进行搜索,看到第二级的文献列表
第四步:再次点击“定义规则”,为文献列表定义规则
第五步:再次切换到“普通浏览”模式,点击其中一篇文献,可以观察到,弹出了一个新的浏览器窗口
在这个新的浏览器窗口可以再次进入到定义规则模式,定义第三级。但是,这里要注意了,针对弹出窗口这种情况,要么使用层级采集(就像你现在定义的规则),要么使用旗舰版的飞掠模式。
但是这个网站上从文献列表采集到的网址不能直接用于层级采集,因为这个网址不能拷贝到另一个窗口中用,一定要在列表页上点击。这种情况要用飞掠模式进行解决。或者研究一下网址的规律,看看是否能从第二级的采集结果中构造出第三级的网址来
|
|
共 2 个关于本帖的回复 最后回复于 2018-1-1 21:48