目标网站为携程网,需要查找经济连锁酒店的信息,因此需要把搜索范围限制在“经济连锁酒店”这一范围内。




然而不管是否点击“经济连锁酒店”,其网页地址不变。

目前我采用的是 层级搜索+翻页搜索,通过增加搜索关键字来进行拔取数据,但显得太麻烦了。 是否可以通过模拟点击或其他方式获取数据


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-12-23 15:52

沙发
Fuller 管理员 发表于 2016-8-8 14:56:21 | 只看该作者
定义连续动作规则,这个功能属于免费版范围。如果你有大量关键词需要输入,最好购买连发弹仓这个装备,因为免费版是把关键词放在规则中,一个规则只能包括5个关键词。而连发弹仓把关键词单独放,放多少都行,在会员中心录入或者批量导入进行
举报 使用道具
板凳
懵懵的girl 初级会员 发表于 2016-12-23 12:56:39 | 只看该作者
怎么实现呀
举报 使用道具
地板
xandy 论坛元老 发表于 2016-12-23 15:52:30 | 只看该作者

你在搜索之前,如果要先执行一串的动作,比如输入目的地,选择时间,输入关键词,或是点击经济型酒店等等,就要做连续动作。做两个规则,第一个规则让爬虫模拟你的动作,第二个规则采集搜索后的结果。
连续动作教程参看:《连续动作让爬虫持续采集数据
可以看看里头的应用场景,理解下原理。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简
  • 聚类分析和主题分析中的特征选择参数的设置
  • 为集搜客分词和情感分析扩展模块安装情感分

热门用户

GMT+8, 2026-3-10 21:17