抓取的数据结果怎么查看

2015-10-13 10:35| 发布者: ym| 查看: 17613| 评论: 0

摘要: 如何查看结果文件 DS打数机是以网址为单位抓取数据的,而抓取结果是以网页为单位的,也就是说输入网址数1的话,就只抓一个网址的数据,如果是没有翻页的话就得到一个结果文件,如果抓取规则里有翻页操作,那么在抓这 ...

DS打数机是以网址为单位抓取数据的,而抓取结果是以网页为单位存储的,也就是说输入线索数为1的话,就只抓一个网址的数据,如果是没有翻页的话,就得到一个结果文件,如果有翻页操作,那么在抓这个网址的时候就会翻页,每抓一页就得到一个结果文件。查看数据结果的操作如下:

1.点击DS打数机的“文件”菜单->“存储路径”,弹出“自定义存储路径”会话框,在这里可以看到数据文件的存储路径,如图1。PS:也可以选择自己喜欢的文件夹作为存储路径。

图1 存储路径

2.根据这个存储路径,打开本地文件夹DataScraperWorks,一个主题名对应一个文件夹,打开就可以看到成功抓取的xml结果文件,每一个网页生成一个结果文件,如图2。

图2 数据文件

3.数据文件是XML类型的,可以用记事本、浏览器打开,也可以用Excel打开,excel格式如图3,可参考教程《xml转换excel格式》。

图3 xml转换为excel



若有疑问可以集搜客网络爬虫
3

鲜花

握手

雷人
2

路过

鸡蛋

刚表态过的朋友 (5 人)

相关阅读

最新评论

GMT+8, 2024-12-4 20:01