如何使用数据DIY采集房源信息

2018-3-21 16:31| 发布者: wangyong| 查看: 7592| 评论: 1

摘要: 今天我来给大家分享一个不用技术,不需要编程开发,可以直接使用的一个快捷采集的软件,只用添加需要采集的网页链接就可以将网页上的数据采集到本地,放到EXCEL表格当中给我们做数据分析。链家作为一个全国二手房市 ...
      今天我来给大家分享一个不用技术,不需要编程开发,可以直接使用的一个快捷采集的软件,只用添加需要采集的网页链接就可以将网页上的数据采集到本地,放到EXCEL表格当中给我们做数据分析。链家作为一个全国二手房市场的代表企业,二手房数据也是比较全的。下面就以链家二手房为示例,给大家讲讲如何使用GooSeeker网络爬虫采集房源信息。

   下面给大家分享下快速采集链家二手房信息的步骤。

1,准备工具——GooSeeker网络爬虫
    在GooSeeker官网下载爬虫软件,安装并打开软件,登录爬虫账号

2,使用链家二手房列表数据DIY,快速采集
    数据DIY是GooSeekr网络爬虫推出的一个快速采集工具,不需要编程,直接用

    1)进入数据DIY,从GooSeekr网站的顶部菜单进入路线是:资源——>数据DIY


    2)在数据DIY网页上,依次选择 类别——网站——网页
    链家的具体类型是:
  • 类别:房地产
  • 网站:链家
  • 网页:链家二手房在售房源列表
    参考下图

3)对比样本页面,观察页面结构,输入的网址一定要和样本页面具有相同的页面结构,否则会采集失败

链家的样本页面是这个样子的

你可能看到的需要采集的页面是这样的,可以对比一下,它们是一样的。

可以看出两个页面几乎一样,只是地区不同而已

4)输入要采集的网址,选择采集全部就能一直翻页往下采,点击获取数据,并启动采集

会看到一个提示,要求启动爬虫窗口。而且会启动2个窗口,一个用来采集数据,一个用来打包数据。运行期间不要关闭它们,也不要最小化。但是这些窗口上面可以覆盖其他窗口。

5)等待采集完成,打包下载数据

注意:提示采集完成后不要立马关闭窗口哦,需等待打包按钮绿色,采集采集状态变成已采集

6)打包数据

7)下载数据

8)到这里我们的数据就已经采集来下了,让我们看看采集到的数据吧

9)采集完二手房列表信息之后还可以将详情链家添加到链家二手房在售房源详情信息中采集二手房房源的详情信息



鲜花

握手

雷人

路过

鸡蛋

相关阅读

发表评论

最新评论

评论 Dave希泽 2018-4-3 11:21
好,不错,用起来很方便。不一会儿,就把罗湖区的二手房源采集完成了

查看全部评论(1)

GMT+8, 2024-3-29 20:48