有可以解决网页结构不一致的方法吗?想要爬取好大夫在线网站的医生信息,但是医生个人网站链接里面由于开通的功能不一样,网页的结构有所差异   导致爬出的数据有的是空白的   请问有相应的解决办法吗?   肿瘤一级 肿瘤二级  肿瘤三级(所有爬取的数据只取一个关键字段)
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2018-9-8 16:02

沙发
Fuller 管理员 发表于 2018-9-8 16:02:57 | 只看该作者
哪一级规则有爬空的情况?再把那个网址也发出来我测试一下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-14 15:07