想抓取lng、lat两个坐标信息(如下图),但在MS谋数台网页标签中找不到对应的位置。求助。

样本页面为:http://hotels.ctrip.com/hotel/10 ... hod_sr_lst_dl_n_1_1

网页源代码截图如下


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-6-7 15:23

沙发
shenzhenuser1 版主 发表于 2017-6-5 11:11:10 | 只看该作者
源代码里的经纬度是在什么节点下?
举报 使用道具
板凳
eino11 中级会员 发表于 2017-6-7 08:58:01 | 只看该作者
wangyong 发表于 2017-6-5 11:11
源代码里的经纬度是在什么节点下?

我找不到对应的节点位置。。。。网页显示出来的内容里没有直接对应这个的
举报 使用道具
地板
xandy 论坛元老 发表于 2017-6-7 10:09:00 | 只看该作者
看你的截图是在JS代码里头,你可以将源代码抓下来,然后用xpath将经纬度提取出来。
抓取源代码参看教程:《采集网页源代码
xpath教程参看:《xpath使用substring-before()和substring-after()

举报 使用道具
5#
eino11 中级会员 发表于 2017-6-7 14:43:37 | 只看该作者
用//script[contains(.,'lat')] 搜索定位到了,mark一下。
xpath和substring正在学习中~
举报 使用道具
6#
Fuller 管理员 发表于 2017-6-7 15:23:12 | 只看该作者
eino11 发表于 2017-6-7 14:43
用//script[contains(.,'lat')] 搜索定位到了,mark一下。
xpath和substring正在学习中~

现在越来越多的位置服务把经纬度隐藏了,能找到的话尽早采集。MS谋数台上中部有一个搜索按钮,可以构造xpath进行搜索
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-31 08:03