第一主题


------------------------------------------------------------------------------------------
第二主题

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 32 个关于本帖的回复 最后回复于 2017-9-30 15:31

沙发
bowieD 金牌会员 发表于 2017-9-29 18:11:00 | 只看该作者
既然第二级规则已经有线索了 说明下级线索没有问题 所以应该是你的翻页没做好 第一级规则实际上并没有翻页 你可以重新跑一遍第一级规则 留意看看是否有翻页 如果没有 说明翻页有问题 去MS重新加载修改
举报 使用道具
板凳
wwqing 初级会员 发表于 2017-9-29 18:13:09 | 只看该作者
bowieD 发表于 2017-9-29 18:11
既然第二级规则已经有线索了 说明下级线索没有问题 所以应该是你的翻页没做好 第一级规则实际上并没有翻页  ...

绝对翻页了 每一页一个文件
举报 使用道具
地板
bowieD 金牌会员 发表于 2017-9-29 18:17:13 | 只看该作者
你的二级规则“板块”,根本就不是采集的帖子里内容啊
举报 使用道具
5#
wwqing 初级会员 发表于 2017-9-29 18:19:29 | 只看该作者
bowieD 发表于 2017-9-29 18:17
你的二级规则“板块”,根本就不是采集的帖子里内容啊

教程里说的

第三步:定义第二级规则

点击“规则”菜单->“新建”,工作台会被清空,就可以开始做第二级主题的规则,拷贝第二级页面的样例网址到输入框,命名主题里要填第二级主题名前面第一级规则的下级线索里填的目标主题名


那实际应该怎么填


举报 使用道具
6#
bowieD 金牌会员 发表于 2017-9-29 18:20:16 | 只看该作者
看下这个教程《层级抓取》
举报 使用道具
7#
wwqing 初级会员 发表于 2017-9-29 18:28:15 | 只看该作者
bowieD 发表于 2017-9-29 18:20
看下这个教程《层级抓取》

<q1>六类屏蔽网线对接地有什么要求?</q1><wz>thread-253900-1-10.html</wz></item><item><q1>K3 内部散热改造加装散热片,不喜绕道。</q1><wz>thread-255317-1-10.html</wz></item><item><q1>希望有大神能给K3做一个集成去广告带图形界面的官改固件</q1><wz>thread-217269-1-10.html</wz></item><item><q1>xkcptun有人配置成功了没</q1><wz>thread-249046-1-10.html</wz></item>
-----------------------------------------------------------------
我第一级就能成功抓下来帖子的主题和网址了 所以不存在第一级的问题
举报 使用道具
8#
umsung 高级会员 发表于 2017-9-29 18:36:05 | 只看该作者
1,是你的第二级规则选择的样本页面有问题,你的第一级规则的样本页面和第二级规则的样本页面有关联吗?
2,选择一个合适的第二级规则的样本页面,比如从从第一级页面点击链接进入,选一个内容比较全的
举报 使用道具
9#
umsung 高级会员 发表于 2017-9-29 18:40:02 | 只看该作者
你第一级规则是没问题,能把主题和网址采集下来,但你采集下来的网址不能作为你的第二级抓取规则的线索,因为你的二级规则选用的样本页面根本就不是通过点击一级规则的网址进入的。
举报 使用道具
10#
wwqing 初级会员 发表于 2017-9-29 18:40:31 | 只看该作者
umsung 发表于 2017-9-29 18:36
1,是你的第二级规则选择的样本页面有问题,你的第一级规则的样本页面和第二级规则的样本页面有关联吗?
2 ...

不是以主题名为关联了吗 第一级的线索2主题名就是给第二级做主题名关联起来的啊
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-10 15:42