xml转换为excel

2016-9-28 14:51| 发布者: ym| 查看: 54478| 评论: 21

摘要: 一、操作导航图 通过会员中心使xml格式转为excel格式共有两种方式,分为手工和自动,操作导航图如下: 方式一 : 方式二 : 二、操作步骤 方式1:通过数据管理手工导入数据 1.1 把xml文件打包成zip格式,不要夹杂 ...

配套软件版本:V9及更低 集搜客网络爬虫

新版本对应教程:V10及更高 数据管家——增强版网络爬虫  的对应教程是《打包下载Excel格式的采集结果数据


注:集搜客GooSeeker爬虫从V9.0.2版本开始,爬虫术语“主题”统一改为“任务”,在爬虫浏览器里先命名任务再创建规则,然后登录集搜客官网会员中心的“任务管理”里,就可以查看任务的采集执行情况、管理线索网址以及做调度设置了。

集搜客网络爬虫采集下来的结果数据是用XML文件存的,如果要转换成Excel格式,需要用到爬虫的导入和导出功能。导入数据的方法又分成手工导入和自动导入两种情况。

  1. 做完采集规则后,点击爬数据或者DS打数机上的单搜或者集搜按钮,这样采集下来的数据是不会自动导入的,需要按照本教程讲解的方法导入数据。
  2. 对规则设置了调度,而且勾选了自动入库,或者使用微博采集工具箱和快捷采集工具,那么都会自动导入,用户只需在规则管理那里导出数据即可。

通过会员中心使xml格式转为excel格式,手工导入导出的操作步骤如下:注意控制ZIP包的大小


二、手工导入操作步骤

打数机采集下来的数据,一页一个XML文件,存放在硬盘的DataScraperWorks目录下,相应主题名文件夹里

1,在硬盘的主题名文件夹里选中多个xml文件直接压缩到zip包,不要夹杂除xml外的文件夹其他文件类型

2,登录集搜客官网,进入会员中心->任务管理。

3,点击对应的任务名进入到该任务的管理页面,点击“数据”按钮->“导入XML”,选择XML的压缩包zip,导入。

4,导入成功后即可“导出数据”,在“历史记录”中可以重复下载。下载的数据,默认保存在本地的下载目录。 

注意:ZIP包不能大于10M,为了稳定上传,最好分批压缩成多个2M的包。

【注意】数据管理功能是增值服务,每个规则可以免费导出1万条数据,超额,会提示购买“专业版or旗舰版爬虫”。

三、自动导入操作步骤

在会员中心给自己做的规则设置调度,而且勾选了自动入库,如果运行起来爬虫群模式,爬虫群就能自动入库。关于调度设置如何操作,请参看《调度设置操作介绍》

上篇文章:《采集网页数据》                                                                           下篇文章:《DS打数机采集数据》

若有疑问可以集搜客爬虫软件
21

鲜花

握手

雷人

路过

鸡蛋

刚表态过的朋友 (21 人)

上一篇:查看数据结果下一篇:采集列表数据

相关阅读

发表评论

最新评论

评论 Fuller 2021-10-1 09:23
19610805111068: 转换好了,怎么导出呢?导出的excel在哪里找到呢/
点击“导出数据”按钮,就开始下载了,在电脑的“下载‘文件夹里面找
评论 19610805111068 2021-10-1 00:11
转换好了,怎么导出呢?导出的excel在哪里找到呢/
评论 Fuller 2018-11-1 18:17
wq_jsk0222: 如果给自己做的规则在哪里设置调度,勾选自动入库?教程中第4图没有找到,想通过前期设置实现便捷的xml转excel,请高人指点~ ...
感谢指出教程的问题,教程已经修改
评论 wq_jsk0222 2018-11-1 15:42
如果给自己做的规则在哪里设置调度,勾选自动入库?教程中第4图没有找到,想通过前期设置实现便捷的xml转excel,请高人指点~
评论 MYK-鸿鹄 2018-9-14 23:22
你们走啊: 导出的数据找不到在哪里
一般是在本地的下载目录下
评论 你们走啊 2018-9-14 22:52
导出的数据找不到在哪里
评论 Fuller 2018-7-3 16:13
abroad001: 明明excel可以解决的,为什么要多此一举,excel>开发工具>xml 导入(先导入一个,再批量导入)
没有要求先导入一个再导入一批。没有先后关系
评论 abroad001 2018-7-3 14:28
明明excel可以解决的,为什么要多此一举,excel>开发工具>xml 导入(先导入一个,再批量导入)
评论 shengchengx 2017-7-18 17:40
wfh8520: 我尝试在淘宝上抓取数据,导出来只有一个产品的数据,如何做到抓取我在淘宝上搜索的关键词出来的所有的产品的数据呢? ...
自己做的规则么?资源-数据diy  有淘宝的搜索结果采集,试试吧
评论 wfh8520 2017-7-18 17:36
我尝试在淘宝上抓取数据,导出来只有一个产品的数据,如何做到抓取我在淘宝上搜索的关键词出来的所有的产品的数据呢?
评论 gz51837844 2017-7-11 22:30
ace224: 最后一个还是没有介绍怎么转换格式啊?用excel?
你在会员中心导入的是xml文件或打包的zip文件,导出就是excel格式的
评论 ace224 2017-7-11 22:18
最后一个还是没有介绍怎么转换格式啊?用excel?
评论 shenzhenwan10 2017-6-7 11:02
frod_34: 最后一幅图片的界面在哪里能调出来?
最后一幅图是DS打数机的菜单项: 爬虫群->配置
评论 frod_34 2017-6-7 10:43
最后一幅图片的界面在哪里能调出来?
评论 Fuller 2017-4-21 11:15
gs2017: 导入数据,找不到zip文件
在弹出的文件选择框中看不到zip?要选择文件类型的,使用“全选”就能看到所有类型文件
评论 gs2017 2017-4-21 11:11
导入数据,找不到zip文件
评论 Fuller 2017-3-31 13:16
zaixian114: 点了附件第一次找不到那个zip文件,刷新了许多次了,都没有用。
zip文件是需要手工打包的,你已经用压缩文件生成zip了吗?
评论 zaixian114 2017-3-31 12:45
点了附件第一次找不到那个zip文件,刷新了许多次了,都没有用。
评论 cluetest21 2017-3-24 14:35
zaixian114: 导入数据,为什么我点附件的时候不显示那个压缩文件?
点了附件会让你选择文件, 文件类型是xml或者zip格式.
如果点了没反应, 试试刷新一下当前页面
评论 zaixian114 2017-3-24 13:55
导入数据,为什么我点附件的时候不显示那个压缩文件?

查看全部评论(21)

GMT+8, 2024-12-4 19:37