结合了几个帖终于实现,方法给大家参考下,祝一次成功。

首先直接查看:https://www.gooseeker.com/doc/article-371-1.html
第一级规则先定义连续动作,第二级规则才定义需要采集的评论文本。


第一级规则中进行连续动作的定义,综合了https://www.gooseeker.com/doc/thread-10363-1-1.html、https://www.gooseeker.com/doc/thread-17634-1-1.html、https://www.gooseeker.com/doc/thread-11418-1-1.html才实现,即:
1,点击累计评价://div/ul/li[contains(./a/text(),'累计评价')]
2,点击排序框://*[@class='tm-current']
3,点击时间排序://*[@class='tm-r-time'],这个还需打开
高级设置取消模拟点击,设置上延时3秒

需要注意:第二级规则的主题名 需和 第一级规则的连续动作填写的目标任务名一致。


其他的仔细查看第一个链接的教程。


实现不了的话,就当没发过这帖哈。


举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-9-29 15:28

wangyong 版主 发表于 2020-9-29 15:28:25 | 显示全部楼层
这个方法可以实现,但是可以更加单,只保留第一步和第三步连续动作就行,第三步取消模拟点击后爬虫就能自动点击到按时间排序
1,点击累计评价://div/ul/li[contains(./a/text(),'累计评价')]
2,点击时间排序://*[@class='tm-r-time'],这个还需打开高级设置取消模拟点击,设置上延时3秒
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 09:53