最后登录 1970-1-1
最后登录 2025-5-4
Fuller 发表于 2019-7-25 18:02 这个网页起码能分成三大块: 1,标题和价格 2,成果基本情况
holamonica 发表于 2019-7-26 10:17 想请问一下,定位是采用绝对定位吗? 试了一下还是有匹配失败的情况
wangyong 发表于 2019-7-26 14:28 不能直接用绝对定位,做上定位标志映射可以精确抓取规则https://www.gooseeker.com/doc/article-344-1.ht ...
holamonica 发表于 2019-7-26 14:59 也就是说选择好顶层的定位标志类型,然后再选用对应的定位方式? 还有一个问题在爬取过程中 这个受不受网 ...
Fuller 发表于 2019-7-26 15:24 也受网速影响,如果加载不出来,如果设置了关键内容,就会匹配失败,如果没有设置关键内容,就会抓漏。 ...
wangyong 发表于 2019-7-26 15:25 默认是超过60秒网页没加载出来就会报错,打数机的配置里可以修改超时时长,爬虫群的调度参数也有超时时长 ...
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2025-5-5 05:22
共 13 个关于本帖的回复 最后回复于 2019-7-26 16:14