集搜客GooSeeker网络爬虫
标题:
翻页抓取和层级抓取的问题
[打印本页]
作者:
Madzero
时间:
2015-9-25 13:20
标题:
翻页抓取和层级抓取的问题
1、层级抓取在执行第二层级页面信息抓取时,若有多条二级页面(并行的),抓取出来的xml文件都是分开的,有没有办法直接让这些同级页面信息直接在抓取时就整合在一个xml文件中
2、翻页抓取也会有这个问题,有没有办法让所有的页面都在一个文件中
求教
作者:
ym
时间:
2015-9-25 14:18
可以把每个规则采集到的xml文件导入一个excel中,可以参考教程
如何将xml文件导入excel
作者:
Madzero
时间:
2015-9-26 09:59
ym 发表于 2015-9-25 14:18
可以把每个规则采集到的xml文件导入一个excel中,可以参考教程如何将xml文件导入excel ...
谢谢
作者:
zjmok9
时间:
2015-9-26 18:06
我用的WPS(微软的office没试过),把xml文件用WPS的EXCEL打开,打开后另存为EXCEL文件。好像很简单哦。
欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/)
Powered by Discuz! X3.2