|
我给你做了两级规则:
第一级:知网文献检索_检索结果
第二级:知网文献检索_HTML阅读
不要单独运行第二级,而是从运行第一级开始。
第一级采集搜索结果列表,然后按个点击 html阅读,点击后会弹出一个新窗口,用第二级采集。正常的话,过几秒钟弹出的窗口会自动关闭,又会弹出下一个窗口。
因为我在校园网外,无法准确做第二级的规则,我把整个网页内容都采集下来了,你可以调整一下这个规则,在DOM树上找到只包含右栏内容的那个div,然后做内容映射。
上图红框,我选择了整个body,这个范围很大,你可以找到内部的只包含右栏的那个div,点击鼠标右键,选择菜单 内容映射-》内容,然后存规则。调整一下这个规则。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 6 个关于本帖的回复 最后回复于 2020-10-13 17:13