0 11246

单搜和集搜的区别

AnswerDSL 于 2017-1-13 15:39 发表 [复制链接]
本帖最后由 ym 于 2017-2-8 16:59 编辑

  • 单搜
“单搜”是“抓取网页”的快捷键,点击“单搜”按钮就会弹出“抓取网页”的会话窗口,设置需要抓取的线索数量并确定后,就会在管理窗口中启动抓取任务,具体的抓取情况可以点击“状态面板”的“性能”查看;

注意:DS打数机只允许一个主题启动“单搜”功能,若想再启动新主题的“单搜”功能,管理窗口就会中断上一个主题的抓取任务,转而抓取新主题的网页数据,即“单搜”是覆盖执行的。

  • 集搜
“集搜”是“单搜”的升级版,每个主题都可以启动“集搜”功能,点击主题的“集搜”按钮后,弹出“抓取网页”会话窗口,设置抓取线索数量并确定后,将会自动弹出新的简化版DS打数机窗口(集搜窗口),与原来的管理窗口同时抓取网页数据,能够高效抓取数据;

DS打数机最多允许20个集搜窗口,这是因为主题列表最多显示20个主题名,所以,一共能够启动20个集搜窗口,并且,每个主题的集搜窗口都有固定的编号,与列表中的主题序号一一对应。如果运行了20个集搜窗口,还要再运行新主题的集搜窗口,那么根据新主题在主题列表中的序号,DS打数机就会使用对应编号的集搜窗口,从而把先前运行的那个主题给强制停止了,与“单搜”一样是覆盖执行的,所以,运行集搜窗口要注意主题序号和集搜窗口编号的对应关系,以减少强制停止的情况。

Tips:DS打数机窗口也叫做爬虫窗口,其中,具有菜单栏和操作窗口的DS打数机窗口称为管理窗口,但只有一个;而简化版的DS打数机窗口可以有多个,但是没有菜单栏和主操作窗口,只是纯粹用于抓取数据,例如:集搜窗口就是单纯抓取数据的简化版窗口。
举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2017-1-13 15:39

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 17:19