快捷导航
规则名叫“defenseone第二层”上层规则是“defenseone样本爬取第一层” 第一层爬取成功 第二层出现的问题是
(1)DS打数机内出现“没有发现规则中的iframe后停止抓取”的错误后接下来的东西会自动停止抓取,只有手动点击开始抓取才可以再开始。
(2)已经爬过的网站在文件夹已经显示出来了,但在DS打数机内仍然处于“抓取中”
(3)手动点击开始住宅区后有时会重复抓取已经抓取过的网页,有时不会
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2020-1-13 23:50

Fuller 管理员 发表于 2020-1-12 09:42:11 | 显示全部楼层
这两个规则加载分析都不成功
举报 使用道具
Fuller 管理员 发表于 2020-1-12 09:43:58 | 显示全部楼层
第一级规则,我加载以后,看不到搜索结果。根据你的样本页面的网址进行推断,你应该是搜索了“china”这个词。如果用这个网址不能加载页面,说明这不是一个独立网址,那么就要在最前面再做一级规则,负责输入查询条件并点击搜索按钮
举报 使用道具
CassieMouse 高级会员 发表于 2020-1-13 23:50:54 | 显示全部楼层
Fuller 发表于 2020-1-12 09:43
第一级规则,我加载以后,看不到搜索结果。根据你的样本页面的网址进行推断,你应该是搜索了“china”这个 ...

谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-19 17:59