集搜客GooSeeker网络爬虫

标题: 微博用户搜索页为何用户没有“认证”后续的标签、职业信息等会发生错位? [打印本页]

作者: piggy_ljj    时间: 2018-11-6 09:38
标题: 微博用户搜索页为何用户没有“认证”后续的标签、职业信息等会发生错位?
规则名:微博用户搜索页


作者: maomao    时间: 2018-11-6 10:54
可能网页结构不一样。你这是自己写的规则?
作者: Fuller    时间: 2018-11-6 12:05
我加载你的规则测试了,没有发现问题,已经修改过了?出现内容串一起,一般都是网页上有相同class造成的,我看这个网页上也没有class,应该是映射不准造成的。另外,认证信息有没有是空的?如果有空的,那里就会空一个,下面的内容就会往上移一个位置,也许会造成移位
作者: piggy_ljj    时间: 2018-11-7 17:02
maomao 发表于 2018-11-6 10:54
可能网页结构不一样。你这是自己写的规则?

是的呀

作者: piggy_ljj    时间: 2018-11-7 17:03
Fuller 发表于 2018-11-6 12:05
我加载你的规则测试了,没有发现问题,已经修改过了?出现内容串一起,一般都是网页上有相同class造成的, ...

是的,有的认证信息是空的。是不是没办法解决啦?


作者: Fuller    时间: 2018-11-7 17:40
piggy_ljj 发表于 2018-11-7 17:03
是的,有的认证信息是空的。是不是没办法解决啦?

要自定义xpath,xpath利用网页上的内容,比如“粉丝”这个词,以这个词为参照,这个词后面的数字就是粉丝数。写自定义xpath就会麻烦一些





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2