规则名“二正式打底T恤数据采集动作”
请问,爬取天猫的商品评论时,想按时间排序让评论重排再抓取我的Xpath该怎么写?
按照1.2.3的顺序依次连续动作,其中2是悬浮到“按默认”那里。我的联系点击动作老是不成功,也不知道错误出在哪里。(确切的说,我根本不是很清楚xpath应该定位到哪一级)


举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-11-9 23:13

沙发
BlueSky1992 初级会员 发表于 2017-11-9 21:42:19 | 只看该作者
1的点击位置是进去网页以后的“累积评价”
2的悬浮位置是点过“累积评价”后悬浮在“按默认”(按时间)那个小框
3的点击位置是悬浮过后,按默认,按时间 两项 点击按时间那一项
举报 使用道具
板凳
BlueSky1992 初级会员 发表于 2017-11-9 21:42:52 | 只看该作者
这是那个天猫的网店网址:
https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-14592463410.150.16e6649dFiyoN2&id=546349094236&rn=7488fc04a2174cc2110f632ba791c320&abbucket=13
举报 使用道具
地板
yangwenge 金牌会员 发表于 2017-11-9 22:07:15 | 只看该作者
本帖最后由 yangwenge 于 2017-11-9 22:13 编辑

三个xpath写的都有点问题,连续动作的xpath不需要定位到text()节点,累计评价可以用contains函数定位到,
写好xpath后可以在谋数台的搜索框中搜索看能否定位得到。常用的函数可以参考《 xpath常用函数用法》

1,点击累计评价://div/ul/li[contains(./a/text(),'累计评价')];
2,悬浮排序框://*[@class='tm-current'];
3,选择时间排序://*[@class='tm-r-time']。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
BlueSky1992 初级会员 发表于 2017-11-9 23:13:33 | 只看该作者
完美解决问题,十分感谢!
举报 使用道具
6#
BlueSky1992 初级会员 发表于 2017-11-9 23:13:48 | 只看该作者
yangwenge 发表于 2017-11-9 22:07
三个xpath写的都有点问题,连续动作的xpath不需要定位到text()节点,累计评价可以用contains函数定位到,
...

完美解决问题,十分感谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-9 19:42