本帖最后由 yangwenge 于 2017-11-27 14:48 编辑

【启动采集前的配置】
  • 预先登陆网站:否
  • 配置打码平台:否

【运行方法】— 详见数据DIY图文教程

  • 用GS爬虫浏览器或者是安装了爬虫软件的火狐浏览器访问58同城二手房详情页面;
  • 输入一个或多个58同城二手房详情网址,然后点击“获取数据”;
  • 点击“启动采集”按钮,采集完成后点击“打包”按钮,就可以下载数据了。

举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2020-10-19 10:07

sxp19850719 新手上路 发表于 2017-12-5 08:29:57 | 显示全部楼层
采集状态总是显示已停止,重新采集后还是会显示已停止
举报 使用道具
yangwenge 金牌会员 发表于 2017-12-5 09:10:58 | 显示全部楼层
sxp19850719 发表于 2017-12-5 08:29
采集状态总是显示已停止,重新采集后还是会显示已停止

检查下看看,是否是添加的网址和样本页面的网页结构不一样

举报 使用道具
kk1314 新手上路 发表于 2020-10-18 19:15:13 | 显示全部楼层
样本页面失效
举报 使用道具
Fuller 管理员 发表于 2020-10-19 10:07:58 | 显示全部楼层

这个是采集二手房详情信息的快捷采集工具,因为房产信息很快会下架,网址很快就失效了,只要按照要求找一个能打开的网址就可以替换老的样本页面。

二手房是一个专门的网站板块,在这个板块中点开一个房产条目,就能进入到详情页,把网址拷贝下来就行。下面截图是二手房列表页,每一条房产信息可以点击进去,这个工具就是采集点击进去的那个网页。

二手房20201019100716.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 06:44