11#
sagehxq 初级会员 发表于 2017-3-3 09:09:18 | 只看该作者
Fuller 发表于 2017-3-2 09:05
组合使用substring-after()和substring-before()能把文本内容切出来,也可以作为判断条件进行定位
...

而且,substring-after()和substring-before()只能针对某个节点下的文本,对吗?

举报 使用道具
12#
ym 版主 发表于 2017-3-3 09:43:08 | 只看该作者
sagehxq 发表于 2017-3-3 09:09
而且,substring-after()和substring-before()只能针对某个节点下的文本,对吗?

...

是的,你可以用整篇文章的那个html节点作为提取信息的初始值。

举报 使用道具
13#
sagehxq 初级会员 发表于 2017-3-3 09:55:42 | 只看该作者
ym 发表于 2017-3-3 09:43
是的,你可以用整篇文章的那个html节点作为提取信息的初始值。

能不能举个例子啊,这样讲得比较抽象,恕我愚钝。谢谢!
举报 使用道具
14#
xandy 论坛元老 发表于 2017-3-3 10:09:15 | 只看该作者
sagehxq 发表于 2017-3-3 09:55
能不能举个例子啊,这样讲得比较抽象,恕我愚钝。谢谢!

如下图所示,将整个HTML内容映射给要抓的内容。

然后,给该采集字段勾选高级设置->勾选自定义xpath->勾选文本内容,将xpath语句复制进抓取内容表达式:
  1. substring-before(substring-after(.,'主要产品与服务项目'),'普通股股票转让方式')
复制代码
就可以抓到如下结果了:


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
15#
sagehxq 初级会员 发表于 2017-3-3 10:41:57 | 只看该作者
xandy 发表于 2017-3-3 10:09
如下图所示,将整个HTML内容映射给要抓的内容。

然后,给该采集字段勾选高级设置->勾选自定义xpath->勾选 ...

为什么我做出来的结果是这样呢?可能哪里出问题了?我是按照您的方法来的啊!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
16#
sagehxq 初级会员 发表于 2017-3-3 10:44:39 | 只看该作者
xandy 发表于 2017-3-3 10:09
如下图所示,将整个HTML内容映射给要抓的内容。

然后,给该采集字段勾选高级设置->勾选自定义xpath->勾选 ...

这个xpath在搜索栏里定位不到dom节点,不知道哪里有问题。好捉急!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
17#
xandy 论坛元老 发表于 2017-3-3 10:49:28 | 只看该作者
sagehxq 发表于 2017-3-3 10:44
这个xpath在搜索栏里定位不到dom节点,不知道哪里有问题。好捉急!

高级设置里面xpath要复制进去。
这个xpath里头有函数,不能直接在搜索框进行搜索。
举报 使用道具
18#
sagehxq 初级会员 发表于 2017-3-3 11:02:12 | 只看该作者
xandy 发表于 2017-3-3 10:49
高级设置里面xpath要复制进去。
这个xpath里头有函数,不能直接在搜索框进行搜索。
...

对啊,我是将substring-before(substring-after(.,'主要产品与服务项目'),'普通股股票转让方式')复制到了“抓取内容表达式”这个文本框里了的。但是一点击测试,输出信息就是没有您的结果啊!

举报 使用道具
19#
sagehxq 初级会员 发表于 2017-3-3 11:03:34 | 只看该作者
xandy 发表于 2017-3-3 10:49
高级设置里面xpath要复制进去。
这个xpath里头有函数,不能直接在搜索框进行搜索。
...


对啊,我是将substring-before(substring-after(.,'主要产品与服务项目'),'普通股股票转让方式')复制到了“抓取内容表达式”这个文本框里了的。但是一点击测试,输出信息就是没有您的结果啊!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
20#
xandy 论坛元老 发表于 2017-3-3 11:10:35 | 只看该作者
sagehxq 发表于 2017-3-3 11:03
对啊,我是将substring-before(substring-after(.,'主要产品与服务项目'),'普通股股票转让方式')复制到 ...

刷新网页结构,然后重新试试吧,多试几次!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-5 01:29