集搜客GooSeeker网络爬虫

标题: 翻页抓取和层级抓取的问题 [打印本页]

作者: Madzero    时间: 2015-9-25 13:20
标题: 翻页抓取和层级抓取的问题
1、层级抓取在执行第二层级页面信息抓取时,若有多条二级页面(并行的),抓取出来的xml文件都是分开的,有没有办法直接让这些同级页面信息直接在抓取时就整合在一个xml文件中

2、翻页抓取也会有这个问题,有没有办法让所有的页面都在一个文件中

求教


作者: ym    时间: 2015-9-25 14:18
可以把每个规则采集到的xml文件导入一个excel中,可以参考教程如何将xml文件导入excel
作者: Madzero    时间: 2015-9-26 09:59
ym 发表于 2015-9-25 14:18
可以把每个规则采集到的xml文件导入一个excel中,可以参考教程如何将xml文件导入excel ...

谢谢
作者: zjmok9    时间: 2015-9-26 18:06
我用的WPS(微软的office没试过),把xml文件用WPS的EXCEL打开,打开后另存为EXCEL文件。好像很简单哦。




欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2