为何采集总是显示失败，原因：抓取规则不合适或者超时时间设置过短

jiayuqin

我要采集类似<

http://221.226.118.170:8080/app/jscesis/entpCertQuery/entpCertList.ftl?menucode=0201

这样的网站信息，进去之后要输入公司查询才会出来一系列数据，我想把这个数据采集下来，比如，我先建整理箱，然后做规则，做规则我标注了第一行企业名称，编号，发证机关，有效期和资质，然后做样例复制，样例复制好了后我测试时这样的，然后存规则爬数据，就是失败，请教下哪里错了

xandy · 发表于 2017-5-31 16:48:08

你直接针对该样本网址做规则的话是采集不到信息的，因为这个网址加载之后是查询前的内容，也就是说空白的，要采集查询后的结果内容，要先用“连续动作”（第一个规则）模拟操作，比如输入企业名称和验证码等，然后点击查询，这样结果就出来了，然后再做第二个规则采集查询后的结果。
参看教程：《连续动作：自动搜索关键词采集信息—以京东为例》
PS：旗舰版才有自动打码功能，《加强网络爬虫装备：连发弹仓、飞掠模式、连续打码功能介绍》

为何采集总是显示失败，原因：抓取规则不合适或者超时时间设置过短

本帖子中包含更多资源

共 1 个关于本帖的回复最后回复于 2017-5-31 16:48

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

为何采集总是显示失败，原因：抓取规则不合适或者超时时间设置过短

本帖子中包含更多资源

共 1 个关于本帖的回复 最后回复于 2017-5-31 16:48

推荐板块

精彩推荐

热门话题

热门用户

共 1 个关于本帖的回复最后回复于 2017-5-31 16:48