最后登录 1970-1-1
Fuller 发表于 2017-9-14 18:48 百度搜索结果中的网址是百度自己做了编码的,如果你想要原始网址,必须做一个两层抓取,第一层把编了码的网 ...
umsung 发表于 2017-9-15 14:11 你的规则名是什么? 1,二级规则抓取网址直接映射@href值不行吗? 2,抓取不全一般都是定位不到导致的,可 ...
Lucky嗨嗨 发表于 2017-9-15 12:41 我试了一下、第二层怎么设置?还是设置抓取网址吗?再抓一次啊?另外为什么我抓取的第一层的网址数量不够 ...
ym 发表于 2017-9-23 15:54 搜索结果里包含了广告或者是特殊的网页结果,它们的网页结构与普通的搜索结果不同,你做的规则没覆盖到这 ...
Lucky嗨嗨 发表于 2017-9-23 17:07 不用专门抓网址是什么意思?不是要让网址作为下层线索吗?
Lucky嗨嗨 发表于 2017-9-23 17:24 我应该怎么做规则才会覆盖到全部的结果啊?大神指点!拜托了!
ym 发表于 2017-9-23 18:12 请去分析网页结构,规则里做自定义xpath设置,实现多种网页结构的兼容,参考教程http://www.gooseeker.co ...
您需要 登录 才可以下载或查看,没有帐号?立即注册
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2025-5-10 13:56