|
根据这些网址分析结果,这个字段的自定义xpath可以这样
定位表达式和内容表达式要用不同的。内容表达式是:
- concat('http://chuangshi.qq.com/bk/', substring-before(substring-after(.//*[@id='readNow']/@href, 'qq.com/bk/'), '-'), '-r-1.html')
复制代码 定位表达式是- .//*[@id='readNow']/@href
复制代码 这样采集到的下级链接总是 -r-1.html网页。
自定义xpath的教程:https://www.gooseeker.com/doc/thread-701-1-1.html
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 5 个关于本帖的回复 最后回复于 2018-9-12 20:07