麻烦指导下如下情况的采集方法及流程:

             需要勾选复选框,然后点击查询,爬去查询结果(网页地址不发生变化),并且翻页标记为图片(上一页,下一页),没有其他文本页码标记;

举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-10-26 11:16

沙发
xandy 论坛元老 发表于 2016-10-26 11:11:53 | 只看该作者
1.需要勾选复选框,然后点击查询,再去抓查询结果
这种问题需要定义连续动作,先后定义“点击->提交”来模拟“勾选复选框”和“点击查询”这两个动作,连续动作的教程请看这里《连续动作让爬虫持续采集
2.翻页标记为图片
针对你说的这种翻页情况,可以参考这个帖子,没有文本记号进行翻页,要用什么匹配
以后碰到翻页的问题可以看看翻页问题锦集


举报 使用道具
板凳
Fuller 管理员 发表于 2016-10-26 11:14:41 | 只看该作者
勾选复选框这个动作就用点击动作来实现,没有专门的“勾复选框”动作
举报 使用道具
地板
singlewalt 初级会员 发表于 2016-10-26 11:15:51 | 只看该作者
xandy 发表于 2016-10-26 11:11
1.需要勾选复选框,然后点击查询,再去抓查询结果
这种问题需要定义连续动作,先后定义“点击->提交”来模 ...

谢谢

举报 使用道具
5#
singlewalt 初级会员 发表于 2016-10-26 11:16:03 | 只看该作者
Fuller 发表于 2016-10-26 11:14
勾选复选框这个动作就用点击动作来实现,没有专门的“勾复选框”动作

谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简
  • 聚类分析和主题分析中的特征选择参数的设置

热门用户

GMT+8, 2026-3-25 02:26