目标: 抓取 http://jgjc.ndrc.gov.cn/list.aspx?clmId=708 网站下各列表中二级网页里的内容,比如: http://jgjc.ndrc.gov.cn/Detail.aspx?newsId=8302&TId=708 里面的各个价格数据。
一级任务名,ndrc_020601 , 抓取成功
二级任务名,ndrc_020602 , 有的网页能抓到,有的抓取失败,日志里面提示:ValidateDelayedPage 抓取失败(超时),抓取规则不合适或者超时时间设置太短
请各位大神指点,谢谢。
|
|
|
|
|
共 4 个关于本帖的回复 最后回复于 2020-2-8 14:32