|
集搜客数据管家V11.1.0版本才支持这个功能。定义规则的时候要注意:大部分情况下是要自定义xpath的,过程是:1. 先用包含所有pdf文件的那个网页区域做内容映射
2. 点击“测试”按钮,找到采集规则,将xpath拷贝出来进行编辑
3. 进入自定义xpath弹窗,编辑好的那个xpath作为定位xpath,再写一个内容xpath。
例如,针对这个网页,用红框的内容做内容映射,然后如下图自定义xpath。分别输入定位xpath和内容xpath的原因:用定位xpath划定一个网页区域,然后用内容xpath从这个区域中采集内容
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 4 个关于本帖的回复 最后回复于 2022-3-14 14:51