获取到的临近节点的xpath如下://*[@id="app"]/div/div[2]/div/div[2]/div[2]/div[2]/div[16]
//*[@id="app"]/div/div[2]/div/div[2]/div[2]/div[2]/div[15]

//*[@id="app"]/div/div[2]/div/div[2]/div[2]/div[2]/div[14]
每个xpath最后一个div中数字决定了页码,如何编写连续动作呢

日历样式翻页

日历样式翻页
举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2018-9-17 16:09

Fuller 管理员 发表于 2018-9-13 09:01:20 | 显示全部楼层
这个xpath: //*[@id="app"]/div/div[2]/div/div[2]/div[2]/div[2]/div[16]
如果16表示页码,那么xpath应该是这样
//*[@id="app"]/div/div[2]/div/div[2]/div[2]/div[2]/div
这样就能覆盖所有的日期,集搜客爬虫就会逐个去点击。


最好先搜索一下,看看xpath是否合适,是否定位到所有的点击位置
搜索20180913085905.png

另外,你的xpath很长,应该是选择了偏好id得到的,可以尝试选择偏好class,看看能否缩短xpath,越短适应性越高
举报 使用道具
zj2233912 初级会员 发表于 2018-9-13 10:09:02 | 显示全部楼层
Fuller 发表于 2018-9-13 09:01
这个xpath: //*[@id="app"]/div/div[2]/div/div[2]/div[2]/div[2]/div[16]
如果16表示页码,那么xpath应该 ...

点击向日期才会出现日历,设置翻页区域和标记为这里,但是好像无法翻页,xpath是对的,但是要在弹出日历后才能搜索得到,如何设置点击动作呢?
G@P]8ENH7_X_L4C5YBVC[NB.png

向下按钮才能弹出日历

向下按钮才能弹出日历
举报 使用道具
Fuller 管理员 发表于 2018-9-13 11:45:20 | 显示全部楼层
主题名是什么?我可以加载分析一下看看
举报 使用道具
zj2233912 初级会员 发表于 2018-9-13 19:35:30 | 显示全部楼层
Fuller 发表于 2018-9-13 11:45
主题名是什么?我可以加载分析一下看看

谢谢大神了,叫:猫眼数据爬取
举报 使用道具
Fuller 管理员 发表于 2018-9-14 12:22:09 | 显示全部楼层
定位20180914121547.png
翻页的记号用了日期,这个日期天天都在变,不适合做记号。

另外,点击动作的xpath,也定位不到节点,这个xpath很长,而且很多像div[2]这样根据位置数字进行定位,适应性很差。

我猜你想点击今日实时那里的日期,进入到日历页。如果是这样的话,用翻页也可以,但是目标主题名应该跟当前的不一样,因为两个网页结构完全不一样

你的连续动作目的是什么?是不是应该在这个日历页上做?
举报 使用道具
zj2233912 初级会员 发表于 2018-9-16 10:32:17 | 显示全部楼层
Fuller 发表于 2018-9-14 12:22
翻页的记号用了日期,这个日期天天都在变,不适合做记号。

另外,点击动作的xpath,也定位不到节点,这个 ...

大佬,我就想翻页,并不知道怎么办
举报 使用道具
Fuller 管理员 发表于 2018-9-16 15:29:35 | 显示全部楼层
zj2233912 发表于 2018-9-16 10:32
大佬,我就想翻页,并不知道怎么办

我测试了你的规则:猫眼数据爬取是有问题的,因为这个网址一加载,并没有进入到有日历的那个网页,需要先点击一下。所以,你应该分成两级规则。在第二级,有日历的那个页面上,你想翻页?
举报 使用道具
Fuller 管理员 发表于 2018-9-16 15:30:18 | 显示全部楼层
你说的翻页是什么意思?是不是选择其他月份?
举报 使用道具
zj2233912 初级会员 发表于 2018-9-17 16:09:53 | 显示全部楼层
Fuller 发表于 2018-9-16 15:30
你说的翻页是什么意思?是不是选择其他月份?

我突然明白了,哈哈哈哈,谢谢大佬
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 17:16