我之前创建了二级规则并创建了下级线索,然后爬数据的时候成功爬取了二级规则的线索(PS二级规则内含有翻页抓取及标题链接,三级规则为层级抓取的内容),然后我运行三级规则发现速度特别慢,而且老是匹配失败,于是我就中断数据爬取,并删除了三级规则主题名。之后按照之前的名字重新创建了三级线索及主题名,但是发现原来的关系图中二级线索的下级线索已经不存在了,成功创建的三级线索图中也不和任何线索形成上下级关联,请问该如何解决(我现在就想知道我的二级线索的主题名与三级线索主题名一致为什么无法关联线索)

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2018-1-4 14:07

沙发
数据集二期 中级会员 发表于 2018-1-4 12:22:28 | 只看该作者
规则名是什么?规则没关联上应该是主题名没对应上,检查爬虫路线的目标主题名和下一级主题名是否一致。
举报 使用道具
板凳
ayeah123 新手上路 发表于 2018-1-4 13:09:52 | 只看该作者
数据集二期 发表于 2018-1-4 12:22
规则名是什么?规则没关联上应该是主题名没对应上,检查爬虫路线的目标主题名和下一级主题名是否一致。 ...

名称一致的,这是二级规则的主题名,这是目标下一级线索的目标主题名,这是创建好的下级规则主题名,检查过,应该是一致的
举报 使用道具
地板
数据集二期 中级会员 发表于 2018-1-4 14:07:10 | 只看该作者
ayeah123 发表于 2018-1-4 13:09
名称一致的,这是二级规则的主题名,这是目标下一级线索的目标主题名,这是创建好的下级规则主题名,检查 ...

看不到你发出来的图片,把规则名用文字贴出来,不然无法检查。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-24 13:47