2 10078

关于“线索”的疑问

huahuaxuwei 于 2017-11-17 23:21 发表 [复制链接]
我做了一个主题规则,很幸运,数据抓取很成功。
但是问题来了,当我再次抓取时,提示我“没有线索了,可添加新线索或者激活已有的线索”。
我点击了“管理线索”的三个选项,都没能解决这个问题。
我不知道时为什么?还有,我看帮助,说这个线索实际就是网址,那么这个网址要是不变的话,是不是这个线索始终存在,那么运行一次之后就再也无法单搜或集搜了?
还有这个“线索”和爬行路线里面的线索有什么区别么?

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2017-11-18 22:54

Fuller 管理员 发表于 2017-11-18 08:52:52 | 显示全部楼层

1,线索:对应了网址,一个网址可以生成一条线索。爬虫相当于一只蜘蛛,线索就是蜘蛛网上的一条丝
2,爬行路线:也就是蜘蛛网上的丝,可以有好多段串起来,从而蜘蛛可以爬到网上任何一点。每一段对应一个网址。所以,说爬虫路线的时候,一般是指从这一段爬到那一段,在工作台上有一个专门的“爬虫路线”工作台,目的就是规划从这一段爬到哪一段。
3,一条线索爬了一次以后,就用过了,必须重新激活才能再爬,参看《管理规则的线索》,但是你说管理线索的三个选项是在哪里点的?DS打数机上?还是会员中心?三个选项是什么?

举报 使用道具
huahuaxuwei 新手上路 发表于 2017-11-18 22:54:54 | 显示全部楼层
谢谢。已经搞定了,我把线索删了造成的,添加上就好了。每次用的时候,激活一下。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 19:45