我新发布了一个采集规则:
安居客_房地产3_新房3_详情


详细信息:
批量采集的使用方法请看教程http://www.gooseeker.com/doc/article-85-1.html。

本规则是整套安居客采集规则的其中一个,本套规则是采集全国新房、二手房、租房数据,由5层级共11个规则组成,若只下载其中一个规则如“安居客_房地产3_租房3_详情”,只需手工把各个租房链接导入到规则里,就能批量采集,参考教程http://www.gooseeker.com/doc/article-172-1.html。
若下载整套规则,那么执行的流程是:
(1)运行第一级规则“安居客_房地产1_城市链接”,把全国各城市名称和网址采下来并把网址自动导入到第二级规则中;
(2)运行第二级规则”安居客_房地产2_目录链接“,采集每个城市的城市名、目录名、网址,并把网址自动导入到第三级规则;
(3)运行第三级规则,第三级有三个规则:“安居客_房地产3_新房1_区域链接”、“安居客_房地产3_二手房1_区域链接”、“安居客_房地产3_租房1_区域链接”,分别采集新房、二手房、租房的各区域的城市、区域名称、区域链接,并把链接导入到第四级规则,因为每个城市会有很多页的房产数据,直接采集的话,容易翻页中断,所以,我们按城市区域来采集,每个区域的房产数据的页码相对较少,可以翻页到最后,从而采集到更多数据;
(4)运行第四级规则,第四级也有三个规则:“安居客_房地产3_新房2_列表”、“安居客_房地产3_二手房2_列表”、“安居客_房地产3_租房2_列表”,分别与第三级对应,用于采集各个区域房产的标题、价格、链接等信息,并把链接自动导入到第五级规则;
(5)运行第五级规则,第五级也有三个规则:“安居客_房地产3_新房3_详情”、“安居客_房地产3_二手房3_详情”、“安居客_房地产3_租房3_详情”,分别与第四级对应,用于采集房产的详细信息。

希望大家喜欢!下载地址:
http://www.gooseeker.com/res/detail_108962.html
举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2016-1-25 15:43

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-1 08:18