本帖最后由 jiangsuxincheng2 于 2017-6-23 17:31 编辑

http://61.132.0.58:8091/ShowXKInfoList.aspx   我要采集这样的网站信息,做第二级规则爬虫路线,记号线索后页,为何最好采集下来的数据全是第一页的数据不断的重复

7`X339PUJOBI%KSDI77S9]Y.png (152.19 KB, 下载次数: 693)

7`X339PUJOBI%KSDI77S9]Y.png
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2017-6-24 09:55

沙发
shenzhenwan10 金牌会员 发表于 2017-6-23 16:52:47 | 只看该作者
你的规则名称是什么
举报 使用道具
板凳
jiangsuxincheng 初级会员 发表于 2017-6-23 16:58:02 | 只看该作者
连云港行政
举报 使用道具
地板
shenzhenwan10 金牌会员 发表于 2017-6-23 17:13:56 | 只看该作者
翻页的配置有问题, 你需要重新映射一下
1. 映射翻页区
2. 做记号映射
可以参考翻页采集列表
举报 使用道具
5#
jiangsuxincheng 初级会员 发表于 2017-6-23 17:30:00 | 只看该作者
你好,帮我看看哪里错了,我以往翻页标志是下一页这样操作都是没问题的
举报 使用道具
6#
jiangsuxincheng 初级会员 发表于 2017-6-23 17:31:53 | 只看该作者
我把图片上传上去了,请帮忙指教下
举报 使用道具
7#
shenzhenwan10 金牌会员 发表于 2017-6-23 17:41:03 | 只看该作者
找到下图所示的DIV, 鼠标右键做一下线索映射



举报 使用道具
8#
jiangsuxincheng 初级会员 发表于 2017-6-24 08:49:47 | 只看该作者
你好,这个翻页设置根据您的提示DIV    page   539    这个做线索映射定位   然后下面的第一个text做记号映射  但是采集的还是第一页内容重复采集     规则名:连云港工商行政
举报 使用道具
9#
shenzhenwan10 金牌会员 发表于 2017-6-24 09:55:22 | 只看该作者
你在爬虫路线工作台, 点击“查看规则”, 把内容截图发出来
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 16:32