11#
Fuller 管理员 发表于 2017-3-28 14:56:54 | 只看该作者
lbl631965186 发表于 2017-3-28 14:38
对,它就呆在一个页面不换

你的规则有些问题,加载不成功,所以,每一页都会失败,就要等很久,跟你设置的超时时长有关,缺省设置是1分钟。你先把规则调整一下吧,关键词那里用上定位标志试试。或者定义一个样例复制,不用每个关键词对应一个抓取内容
举报 使用道具
12#
lbl631965186 新手上路 发表于 2017-3-29 07:55:00 | 只看该作者
我修改好了。

但是知乎的反爬装置启动了我现在都是forbidden的状态!

网页上的爬虫群 和 软件的集搜是一个概念吗?       我虫群打不开,总是提示我没有安装软件。救急啊!!
举报 使用道具
13#
lbl631965186 新手上路 发表于 2017-3-29 07:56:14 | 只看该作者
今晚的ppt展示。若我能雇哪位搜集我所需要的数据也是极好的!!我愿意出五十元。
举报 使用道具
14#
lbl631965186 新手上路 发表于 2017-3-29 07:56:57 | 只看该作者
上课去了,十点回来 求高手受我雇佣
举报 使用道具
15#
xandy 论坛元老 发表于 2017-3-29 14:27:12 | 只看该作者
lbl631965186 发表于 2017-3-29 07:56
上课去了,十点回来 求高手受我雇佣

抓取超时的话很可能是规则没做好,建议你参照这个教程检查下你的规则。《怎样解决规则采集失败/遗漏的问题?》
举报 使用道具
16#
Fuller 管理员 发表于 2017-3-29 14:53:40 | 只看该作者
lbl631965186 发表于 2017-3-29 07:56
上课去了,十点回来 求高手受我雇佣

我加了你的qq,如果需要协助,在qq里面具体谈
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-12 23:52