采集详情网址，网址有多余的部分怎么除去？

移动信息张崭

本帖最后由移动信息张崭于 2020-5-11 11:15 编辑

采集详情网址，网址有多余的部分怎么除去？写了xpath测试了下，没成功。请教下，需要怎么处理？

xpath为：substring-before(substring-after(//*[@class='group_item']/div/@onclick,'location.href=''),'/'')

lan_1985 · 发表于 2020-5-11 11:11:13

本帖最后由 lan_1985 于 2020-5-11 14:51 编辑

后面的 ’不太好识别，写xpath也不太好写。可以试试，先把列表页采集下来，然后导出表，把网址在excell表中，处理好这些网址后，添加到详情网址就行。

移动信息张崭 · 发表于 2020-5-11 16:19:03

lan_1985 发表于 2020-5-11 11:11
后面的 ’不太好识别，写xpath也不太好写。可以试试，先把列表页采集下来，然后导出表，把网址在excell表中 ...

嗯嗯，已经做好了，感谢啦。

采集详情网址，网址有多余的部分怎么除去？

本帖子中包含更多资源

共 2 个关于本帖的回复最后回复于 2020-5-11 16:19

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

采集详情网址，网址有多余的部分怎么除去？

本帖子中包含更多资源

共 2 个关于本帖的回复 最后回复于 2020-5-11 16:19

推荐板块

精彩推荐

热门话题

热门用户

共 2 个关于本帖的回复最后回复于 2020-5-11 16:19