集搜客GooSeeker网络爬虫

标题: 我想去掉抓取内容中的某个符号该如何操作? [打印本页]

作者: umsung    时间: 2017-11-21 16:13
标题: 我想去掉抓取内容中的某个符号该如何操作?
如图所示,如果我想在规则那修改代码过滤掉“¥”该怎么操作?


作者: bowieD    时间: 2017-11-21 16:16
1,最简单的方法就是全部采集下来,通过excel表对价格这一列把“¥”替换成空就可以了
2,可以对抓取内容“价格”自定义xptah,用截取函数substring-before和substring-after可以把“¥”截取掉,可参考《xpath常用函数》




欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2