最后登录 1970-1-1
xandy 发表于 2017-3-15 21:08 打码的话要针对出现验证码的网页做打码动作,好好参看教程:《连续打码:破解各种验证码连续采数据——以工 ...
Tips1:对于采集过程中会弹出验证码的情况如何做规则?
在同一个主题名下建立两个规则,两者的规则编号是不同的,第一个规则就采集正常网页的目标信息,第二个规则就是专门解决验证码弹窗的页面,这样爬虫在遇到验证码弹窗时就会自动输入和验证,然后再回到正常的页面继续采集。
最后登录 2025-5-2
leixiaola 发表于 2017-3-15 21:16 就是参考这个教程操作的
Fuller 发表于 2017-3-15 21:47 关键是这些: 图片定位://*[@id='query']/div/p 输入框定位://*[@id='query']/div/p
您需要 登录 才可以下载或查看,没有帐号?立即注册
leixiaola 发表于 2017-3-15 21:53 Xpath不是要写到区块节点的么? 按照教程中的xpath也没有image 和input 字节 ...
Fuller 发表于 2017-3-15 22:21 那个教程用的是//* 这样的表达式,你看不出来是img还是input,不能定位到区块节点,一定要准确定位 ...
leixiaola 发表于 2017-3-15 22:34 好滴,我明天在调整一下,希望成功 还想请教一下,如果速度和翻页次数都为0,对验证码识别有影响么? ...
Fuller 发表于 2017-3-16 09:33 在哪里设置的翻页次数?是滚屏次数吧?滚屏能放慢速度,防止过快地做识别 ...
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2025-5-4 19:56
共 11 个关于本帖的回复 最后回复于 2017-3-16 11:45