前几天用GooSeeker,还挺爽的,但是这几天滑块无限,根本不知道怎么破解
更换了UA,每天换一个淘宝号和IP,现在速度也不快,抓取时间间隔是5S
但是现在还是滑块好厉害
请问有什么方式解决吗
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2021-4-29 14:09

Fuller 管理员 发表于 2021-2-6 19:16:48 | 显示全部楼层
换IP以后一定要清除缓存和cookie,因为在cookie中记录了一些访问统计信息,如果光换IP,网页还是能利用以往的统计信息判断出来你已经访问得很频繁了。

但是,现在淘宝限制太厉害,即使这些手段都用上也很难大量采集。

清除缓存和cookie的方法:https://www.gooseeker.com/doc/thread-18152-1-1.html
举报 使用道具
a358223957 新手上路 发表于 2021-2-7 11:32:51 | 显示全部楼层
Fuller 发表于 2021-2-6 19:16
换IP以后一定要清除缓存和cookie,因为在cookie中记录了一些访问统计信息,如果光换IP,网页还是能利用以往 ...

我也会每天清理cookie,请问现在还有什么更好点的方式方法吗
举报 使用道具
a358223957 新手上路 发表于 2021-2-7 11:33:30 | 显示全部楼层
很惆怅的,或者是有什么方式可以大量采集吗
举报 使用道具
Fuller 管理员 发表于 2021-2-7 11:40:02 | 显示全部楼层
a358223957 发表于 2021-2-7 11:33
很惆怅的,或者是有什么方式可以大量采集吗

现在这个问题很突出,如果目标网站有意设定限制爬虫的检测,爬虫是没办法突破的,现在的检测手段很高明
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 19:30