11#
努力成为A 初级会员 发表于 2016-1-14 22:35:37 | 只看该作者
谢谢,能抓到了
举报 使用道具
12#
crybzc5664 新手上路 发表于 2016-6-2 09:22:02 | 只看该作者

请问您后面是怎么弄的,可以加个qq么
举报 使用道具
13#
Fuller 管理员 发表于 2016-6-2 09:51:43 | 只看该作者
crybzc5664 发表于 2016-6-2 09:22
请问您后面是怎么弄的,可以加个qq么

页码限制是网站做的,你是无法破解的,除非网站有漏洞,所以,你要考虑的怎样让总页数不要超过50页,其实就是选择更细小的分类。

以前你计划采集一个大类,比如,大类A,他总共有500个分页,现在你就采集大类A下面的小类A1,A2,A3,........,如果有50个子类,那么每个子类的分页数就很少了
举报 使用道具
14#
minchengcheng 初级会员 发表于 2016-9-29 11:53:40 | 只看该作者

能问下,你怎么做到的嘛?
举报 使用道具
15#
shenzhenwan10 金牌会员 发表于 2016-9-29 11:58:49 | 只看该作者
对于翻页数有限制的网站,比如大众点评网最大只能翻50页,应对的方法是采集大类下的小类,或者通过其它条件来进一步细分,最后每个小类的总页数控制在50页内
举报 使用道具
16#
quyixuan 金牌会员 发表于 2016-9-29 11:59:37 | 只看该作者
minchengcheng 发表于 2016-9-29 11:53
能问下,你怎么做到的嘛?

举个例子,比如你抓淘宝男鞋这个大类,淘宝限制了只能翻页到100页,但是你做规则的时候将男鞋分成很多小类来抓,比如分不同品牌,这样你每个品牌都能显示100页的数据,有几个品牌你抓到的数据就相当于翻了几倍了
举报 使用道具
17#
minchengcheng 初级会员 发表于 2016-9-29 17:06:02 | 只看该作者
quyixuan 发表于 2016-9-29 11:59
举个例子,比如你抓淘宝男鞋这个大类,淘宝限制了只能翻页到100页,但是你做规则的时候将男鞋分成很多小 ...

嗯呢,谢谢你
举报 使用道具
18#
李虹颖 新手上路 发表于 2018-5-7 15:31:00 | 只看该作者

但是我的无法再细分类别啦
举报 使用道具
19#
数据集 高级会员 发表于 2018-5-7 15:39:50 | 只看该作者
李虹颖 发表于 2018-5-7 15:31
但是我的无法再细分类别啦

限制翻页的网址,只能通过条件来一步步细分,最后每个小类的总页数控制在翻页限制数以内,超过翻页限制的就无法采集到
举报 使用道具
20#
李虹颖 新手上路 发表于 2018-5-7 15:49:19 | 只看该作者
数据集 发表于 2018-5-7 15:39
限制翻页的网址,只能通过条件来一步步细分,最后每个小类的总页数控制在翻页限制数以内,超过翻页限制的 ...

那我的分类就只要有两个,不管怎么细化,都会超过50页的限制,这个怎么弄啊?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 13:51