Fuller 管理员 发表于 2019-9-6 18:28:17 | 显示全部楼层
Fuller 发表于 2019-9-6 18:22
加载你的规则,出现上面的错误,翻页规则很奇怪,我查查是什么原因
...

翻页记号20190906182652.png

翻页记号是一个 > 号,也是一个text节点,所以,勾上 “文本记号”,将text节点做翻页记号映射。这样就能翻页了
举报 使用道具
才子 新手上路 发表于 2019-9-7 11:29:42 | 显示全部楼层
Fuller 发表于 2019-9-6 18:28
翻页记号是一个 > 号,也是一个text节点,所以,勾上 “文本记号”,将text节点做翻页记号映射。这样就 ...

谢谢
举报 使用道具
xiaoming888 新手上路 发表于 2019-9-7 13:46:47 | 显示全部楼层
Fuller 发表于 2019-9-6 18:28
翻页记号是一个 > 号,也是一个text节点,所以,勾上 “文本记号”,将text节点做翻页记号映射。这样就 ...

按摩足疗商家 这个是任务名称,按照这样设置,搜集出来的数据是一样的,就是翻页后也是一样的
举报 使用道具
Fuller 管理员 发表于 2019-9-7 15:42:38 | 显示全部楼层
xiaoming888 发表于 2019-9-7 13:46
按摩足疗商家 这个是任务名称,按照这样设置,搜集出来的数据是一样的,就是翻页后也是一样的
...

你采集的是商家内容,没有必要翻页,采集一次就行了,翻页是为了采集评论
举报 使用道具
xiaoming888 新手上路 发表于 2019-9-7 16:47:02 | 显示全部楼层
Fuller 发表于 2019-9-7 15:42
你采集的是商家内容,没有必要翻页,采集一次就行了,翻页是为了采集评论
...

我要采集每个商家的信息,就是发给你的上一页有商家列表,但是每个需要点击进去才能采集https://pds.meituan.com/xiuxianyule/c52/这个页面的商家
举报 使用道具
Fuller 管理员 发表于 2019-9-7 21:48:48 | 显示全部楼层
xiaoming888 发表于 2019-9-7 16:47
我要采集每个商家的信息,就是发给你的上一页有商家列表,但是每个需要点击进去才能采集https://pds.meit ...

按照这个教程做两级规则,形成层级采集:https://www.gooseeker.com/doc/article-343-1.html
举报 使用道具
xiaoming888 新手上路 发表于 2019-9-16 17:08:04 | 显示全部楼层
Fuller 发表于 2019-9-7 21:48
按照这个教程做两级规则,形成层级采集:https://www.gooseeker.com/doc/article-343-1.html
...

你好,我的任务名称是平顶山休闲娱乐列表,为什么只能抓取50条信息,帮我看下哪里出问题了,谢谢
举报 使用道具
Fuller 管理员 发表于 2019-9-16 21:43:27 | 显示全部楼层
xiaoming888 发表于 2019-9-16 17:08
你好,我的任务名称是平顶山休闲娱乐列表,为什么只能抓取50条信息,帮我看下哪里出问题了,谢谢 ...

我测试你的规则翻页很好,你的DS打数机是不是没有开自动滚屏?菜单 配置-》滚屏参数,把滚屏次数设置成>0的数字,比如,2,就开始滚屏
举报 使用道具
桥豆麻袋18057522843 新手上路 发表于 2020-11-24 18:54:28 | 显示全部楼层
Fuller 发表于 2019-4-9 22:28
你用这个a节点映射给公司名称,如果定位偏好设置成偏好class,就会自动选择@class = 'name',但是网页上 ...

你好,可以讲清楚一点步骤吗,什么叫a节点映射给公司名称,实在不懂

我是这样的

我是这样的
举报 使用道具
Fuller 管理员 发表于 2020-11-24 19:39:34 | 显示全部楼层
桥豆麻袋18057522843 发表于 2020-11-24 18:54
你好,可以讲清楚一点步骤吗,什么叫a节点映射给公司名称,实在不懂

看这个教程:《集搜客网络爬虫使用方法入门
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-22 02:48