麻烦指导下如下情况的采集方法及流程:

             需要勾选复选框,然后点击查询,爬去查询结果(网页地址不发生变化),并且翻页标记为图片(上一页,下一页),没有其他文本页码标记;

举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-10-26 11:16

沙发
xandy 论坛元老 发表于 2016-10-26 11:11:53 | 只看该作者
1.需要勾选复选框,然后点击查询,再去抓查询结果
这种问题需要定义连续动作,先后定义“点击->提交”来模拟“勾选复选框”和“点击查询”这两个动作,连续动作的教程请看这里《连续动作让爬虫持续采集
2.翻页标记为图片
针对你说的这种翻页情况,可以参考这个帖子,没有文本记号进行翻页,要用什么匹配
以后碰到翻页的问题可以看看翻页问题锦集


举报 使用道具
板凳
Fuller 管理员 发表于 2016-10-26 11:14:41 | 只看该作者
勾选复选框这个动作就用点击动作来实现,没有专门的“勾复选框”动作
举报 使用道具
地板
singlewalt 初级会员 发表于 2016-10-26 11:15:51 | 只看该作者
xandy 发表于 2016-10-26 11:11
1.需要勾选复选框,然后点击查询,再去抓查询结果
这种问题需要定义连续动作,先后定义“点击->提交”来模 ...

谢谢

举报 使用道具
5#
singlewalt 初级会员 发表于 2016-10-26 11:16:03 | 只看该作者
Fuller 发表于 2016-10-26 11:14
勾选复选框这个动作就用点击动作来实现,没有专门的“勾复选框”动作

谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-5 21:15