快捷导航
规则名:微博用户搜索页

异常(无认证 后续信息发生错位)

异常(无认证 后续信息发生错位)

正常(有认证 未发生错位)

正常(有认证 未发生错位)
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2018-11-7 17:40

maomao 金牌会员 发表于 2018-11-6 10:54:29 | 显示全部楼层
可能网页结构不一样。你这是自己写的规则?
举报 使用道具
Fuller 管理员 发表于 2018-11-6 12:05:39 | 显示全部楼层
我加载你的规则测试了,没有发现问题,已经修改过了?出现内容串一起,一般都是网页上有相同class造成的,我看这个网页上也没有class,应该是映射不准造成的。另外,认证信息有没有是空的?如果有空的,那里就会空一个,下面的内容就会往上移一个位置,也许会造成移位
举报 使用道具
piggy_ljj 中级会员 发表于 2018-11-7 17:02:47 | 显示全部楼层
maomao 发表于 2018-11-6 10:54
可能网页结构不一样。你这是自己写的规则?

是的呀
举报 使用道具
piggy_ljj 中级会员 发表于 2018-11-7 17:03:33 | 显示全部楼层
Fuller 发表于 2018-11-6 12:05
我加载你的规则测试了,没有发现问题,已经修改过了?出现内容串一起,一般都是网页上有相同class造成的, ...

是的,有的认证信息是空的。是不是没办法解决啦?

举报 使用道具
Fuller 管理员 发表于 2018-11-7 17:40:15 | 显示全部楼层
piggy_ljj 发表于 2018-11-7 17:03
是的,有的认证信息是空的。是不是没办法解决啦?

要自定义xpath,xpath利用网页上的内容,比如“粉丝”这个词,以这个词为参照,这个词后面的数字就是粉丝数。写自定义xpath就会麻烦一些
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 大型百货商场会员画像描绘
  • 自动导入导出数据
  • 批量爬取蘑菇街商品价格、评论信息
  • 微博用户数据分析
  • 批量爬取苏宁商品价格、评论信息

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2018-11-19 08:29