集搜客GooSeeker网络爬虫

标题: 微博的共同关注列表的规则为什么不能用于其他的相同网页 [打印本页]

作者: 栗子桥    时间: 2017-11-20 15:13
标题: 微博的共同关注列表的规则为什么不能用于其他的相同网页
为某个博主写了一个抓取“共同关注”列表的规则,为什么导入相同网页结构的线索抓取不出数据?
之前抓百度新闻、电商页面都没有碰到这个问题
求解答??谢谢谢谢谢谢~~~~


作者: umsung    时间: 2017-11-20 15:26
本帖最后由 umsung 于 2017-11-20 15:31 编辑

1,把样本页面和导入的其他网页网址贴出来看看,不能抓取应该是网页结构有不一样的地方。
2,要么就是你做的规则有问题,适应性不强

参考这个教程修改《怎样解决规则采集失败/遗漏的问题? 》

作者: wangyong    时间: 2017-11-20 15:28
这个规则现在加载也是会报错,规则重新映射一下,做上定位标志映射
作者: 栗子桥    时间: 2017-11-20 16:07
umsung 发表于 2017-11-20 15:26
1,把样本页面和导入的其他网页网址贴出来看看,不能抓取应该是网页结构有不一样的地方。
2,要么就是你做 ...

如图 第一个是制作规则用的网页 第二个是要抓取的其他网页


作者: 栗子桥    时间: 2017-11-20 16:09
umsung 发表于 2017-11-20 15:26
1,把样本页面和导入的其他网页网址贴出来看看,不能抓取应该是网页结构有不一样的地方。
2,要么就是你做 ...

规则是按照教程里 一步一步的制作 发现好像博主使用了相同的皮肤就可以使用相同的规则 反之不适应。是这个原因吗


作者: umsung    时间: 2017-11-20 16:14
栗子桥 发表于 2017-11-20 16:09
规则是按照教程里 一步一步的制作 发现好像博主使用了相同的皮肤就可以使用相同的规则 反之不适应。是这 ...

不是,你做的那个规则本身有问题,加载进去后续分析就报错了,重新映射一下抓取内容吧,做上定位映射。

作者: 栗子桥    时间: 2017-11-20 16:24
umsung 发表于 2017-11-20 16:14
不是,你做的那个规则本身有问题,加载进去后续分析就报错了,重新映射一下抓取内容吧,做上定位映射。
...

好的 解决了 谢谢您


作者: 栗子桥    时间: 2017-11-20 16:25
wangyong 发表于 2017-11-20 15:28
这个规则现在加载也是会报错,规则重新映射一下,做上定位标志映射

学会了 谢谢您






欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2