11#
umsung 高级会员 发表于 2017-10-19 11:29:52 | 只看该作者
Lucky嗨嗨 发表于 2017-10-12 21:58
我试过,不行的啊,对不起给错你规则了,应该是地质信息服务产品,少了两个字,但是我真的用了,无论是有 ...

使用这个xptah.//*[@class='c-abstract'] | .//*[@class='op-xueshu-detail-subtitle c-gray']/following-sibling::p
可以定位到所有摘要信息
举报 使用道具
12#
Lucky嗨嗨 初级会员 发表于 2017-10-19 13:04:43 | 只看该作者
umsung 发表于 2017-10-19 11:29
使用这个xptah.//*[@class='c-abstract'] | .//*[@class='op-xueshu-detail-subtitle c-gray']/following ...

谢谢我试试


举报 使用道具
13#
Lucky嗨嗨 初级会员 发表于 2017-10-19 17:00:48 | 只看该作者
umsung 发表于 2017-10-19 11:29
使用这个xptah.//*[@class='c-abstract'] | .//*[@class='op-xueshu-detail-subtitle c-gray']/following ...

你能告诉我你是怎么做xpath的吗?为什么我换个关键词就不行了!?

举报 使用道具
14#
umsung 高级会员 发表于 2017-10-19 17:09:24 | 只看该作者
Lucky嗨嗨 发表于 2017-10-19 17:00
你能告诉我你是怎么做xpath的吗?为什么我换个关键词就不行了!?

1,xptah要自己去网上学习,这里有个基础教程《xpath基础知识》
2,勾选的关键内容一定要在每个页面上都能抓到才行,如果勾选了关键内容,在其他页面上没有这个内容而导致抓取不到的话爬虫就会报错,一般的关键内容设置一个就行了。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-11 21:52