本帖最后由 gooseeker_info 于 2015-9-8 16:02 编辑

超时案例.png

:我搜到15个的时候停了   剩下的怎么继续呢

1)VDDPG LOAD这个状态可能是遇到网页结构不符合的页面了,如果抓取规则不符合,就会一直等待到超时。
如果想等待时间短一些,可以重新设置超时时间,DS打数机菜单“配置”->“超时时长”,设置短一些。一开始是10分钟,那就要等很久了,设置成1分钟或者2分钟。

2)最重要的是要研究一下为什么那个网页不适合,在MS谋数台上可以单独分析这个网页。等超时以后,DS谋数台下面日志窗口会显示哪条线索失败了,在MS谋数台上用菜单 “工具”->“加载规则”->“按线索”,输入线索号,MS谋数台就能分析哪个抓取内容抓不到。不是必须要抓的,可以把“关键内容”选项不要选。

类似问题抓取数据的时候,会出现卡住的情况,什么原因?
举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2015-9-8 11:02

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 20:54