快捷导航

xml转换为excel

2016-9-28 14:51| 发布者: ym| 查看: 22685| 评论: 17

摘要: 一、操作导航图 通过会员中心使xml格式转为excel格式共有两种方式,分为手工和自动,操作导航图如下: 方式一 : 方式二 : 二、操作步骤 方式1:通过数据管理手工导入数据 1.1 把xml文件打包成zip格式,不要夹杂 ...

集搜客网络爬虫采集下来的结果数据是用XML文件存的,如果要转换成Excel格式,需要用到爬虫的导入和导出功能(如下面第4图所示)。导入数据的方法又分成手工导入和自动导入两种情况。

  • 如果自己做完采集规则以后,点击爬数据或者DS打数机上的单搜或者集搜按钮,这样采集下来的数据是不会自动导入的,需要按照本教程讲解的方法导入数据。
  • 如果给自己做的规则设置了调度,而且勾选了自动入库(如下面第4图所示),或者使用微博采集工具箱和快捷采集工具,那么都会自动导入,用户只需在规则管理那里导出数据即可。

通过会员中心使xml格式转为excel格式,手工导入导出的操作步骤如下:注意控制ZIP包的大小


二、操作步骤

打数机采集下来的数据,一页一个XML文件,存放在硬盘的DataScraperWorks目录下,相应主题名文件夹里

1,在硬盘的主题名文件夹里选中多个xml文件直接压缩到zip包,不要夹杂除xml外的文件夹其他文件类型

2,登录集搜客官网,进入会员中心->规则管理->我的规则。

3,点击对应主题名进入到管理页面,点击“导入数据”按钮,点击附件,选择数据包zip,点击导入。

4,导入成功后即可“导出数据”,在“历史记录”中可以重复下载。下载的数据,默认保存在本地的下载目录。 

注意:ZIP包不能大于10M,为了稳定上传,最好分批压缩成多个2M的包。




【注意】数据管理功能是增值服务,每个规则可以免费导出1万条数据,超额请购买“专业版or旗舰版爬虫”或“数据仓库”来扩大储存量后再继续导出数据,或购买“仓库清扫”清理旧数据后再来存储新数据。


上篇文章:《采集网页数据》                                                                           下篇文章:《DS打数机采集数据》

若有疑问可以集搜客爬虫软件
11

鲜花

握手

雷人

路过

鸡蛋

刚表态过的朋友 (11 人)

上一篇:查看数据结果下一篇:采集列表数据

相关阅读

发表评论

最新评论

评论 MYK-鸿鹄 2018-9-14 23:22
你们走啊: 导出的数据找不到在哪里
一般是在本地的下载目录下
评论 你们走啊 2018-9-14 22:52
导出的数据找不到在哪里
评论 Fuller 2018-7-3 16:13
abroad001: 明明excel可以解决的,为什么要多此一举,excel>开发工具>xml 导入(先导入一个,再批量导入)
没有要求先导入一个再导入一批。没有先后关系
评论 abroad001 2018-7-3 14:28
明明excel可以解决的,为什么要多此一举,excel>开发工具>xml 导入(先导入一个,再批量导入)
评论 shengchengx 2017-7-18 17:40
wfh8520: 我尝试在淘宝上抓取数据,导出来只有一个产品的数据,如何做到抓取我在淘宝上搜索的关键词出来的所有的产品的数据呢? ...
自己做的规则么?资源-数据diy  有淘宝的搜索结果采集,试试吧
评论 wfh8520 2017-7-18 17:36
我尝试在淘宝上抓取数据,导出来只有一个产品的数据,如何做到抓取我在淘宝上搜索的关键词出来的所有的产品的数据呢?
评论 gz51837844 2017-7-11 22:30
ace224: 最后一个还是没有介绍怎么转换格式啊?用excel?
你在会员中心导入的是xml文件或打包的zip文件,导出就是excel格式的
评论 ace224 2017-7-11 22:18
最后一个还是没有介绍怎么转换格式啊?用excel?
评论 shenzhenwan10 2017-6-7 11:02
frod_34: 最后一幅图片的界面在哪里能调出来?
最后一幅图是DS打数机的菜单项: 爬虫群->配置
评论 frod_34 2017-6-7 10:43
最后一幅图片的界面在哪里能调出来?
评论 Fuller 2017-4-21 11:15
gs2017: 导入数据,找不到zip文件
在弹出的文件选择框中看不到zip?要选择文件类型的,使用“全选”就能看到所有类型文件
评论 gs2017 2017-4-21 11:11
导入数据,找不到zip文件
评论 Fuller 2017-3-31 13:16
zaixian114: 点了附件第一次找不到那个zip文件,刷新了许多次了,都没有用。
zip文件是需要手工打包的,你已经用压缩文件生成zip了吗?
评论 zaixian114 2017-3-31 12:45
点了附件第一次找不到那个zip文件,刷新了许多次了,都没有用。
评论 cluetest21 2017-3-24 14:35
zaixian114: 导入数据,为什么我点附件的时候不显示那个压缩文件?
点了附件会让你选择文件, 文件类型是xml或者zip格式.
如果点了没反应, 试试刷新一下当前页面
评论 zaixian114 2017-3-24 13:55
导入数据,为什么我点附件的时候不显示那个压缩文件?
评论 xzhatlzy 2016-12-22 15:54
露个脸~~~~

查看全部评论(17)

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2018-9-21 09:42