问题一:
正常抓取的页面的内容项Xpath是 .//*[@id='Pl_Official_WeiboDetail__74']/div/div/div/div[2]/div/ul/li[2]/a/span/span/span/em[2]
抓取失败的线索的内容项Xpath是 .//*[@id='Pl_Official_WeiboDetail__59']/div/div/div/div[2]/div/ul/li[2]/a/span/span/span/em[2]
我用原来的规则随便加载了一个失败线索(还增加了超时时长),发现可以正常抓取,那为什么批量抓的时候会失败呢?
问题二:
我想把所有失败线索批量导出来,统一再制作一个规则看看。但是怎么批量导出失败线索呢?
|
|
|
|
|
共 18 个关于本帖的回复 最后回复于 2017-6-11 12:20