如何准确采集网页上指定位置的内容。

黄黄黄辉

比如，网页上有text值为 ” 来源：搜狐网“，如何只抓取到 “搜狐网”。

lan_1985 · 发表于 2019-10-29 15:15:05

1、可以先写xpath定位到这个text节点，然后用公式
substring-after(//*[@class='source'],'来源：')

2、如果是截取 “来源”前面的内容就可以用
substring-before(//*[@class='source'],'来源：')

3、可以接两个公式混合使用，比如“时间前，来源后的内容，就可以写为
substring-after(substring-before(//*[@class='source'],'时间'),'来源'）

参考教程：https://www.gooseeker.com/doc/article-269-1.html

如何准确采集网页上指定位置的内容。

共 1 个关于本帖的回复最后回复于 2019-10-29 15:15

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

如何准确采集网页上指定位置的内容。

共 1 个关于本帖的回复 最后回复于 2019-10-29 15:15

推荐板块

精彩推荐

热门话题

热门用户

共 1 个关于本帖的回复最后回复于 2019-10-29 15:15