本帖最后由 1866905838 于 2017-3-13 23:46 编辑

第一层主题:艺术个人信息

第二层主题:医生个人信息2
第三层主题:医生个人信息3

第一层连接第二层,第二层模拟点击后取内容

问题:
为啥运行第一层主题后,主题2和主题3没有结果?
请大神诊断诊断
但是手动运行主题1后,在运行主题2,能带出主题3的内容,

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-3-15 09:43

沙发
HJLing 版主 发表于 2017-3-14 10:29:58 | 只看该作者
第一级规则(艺术个人信息)和第二级规则(医生个人信息2)是层级关系 需要分开运行
即:既要手动去运行第一级规则 也要去运行第二级规则
第二级规则(医生个人信息2)和第三级规则(医生个人信息3)是模拟点击联系起来的 所以不需要手动运行第三级规则
你运行第二级规则的时候就会自动调用第三级规则

所以 你需要手动运行第一级规则和第二级规则

另外 你的第二级规则 给完整内容建立了一个下级线索 这是多余的 查看完整内容不是个链接而是文本 这样做反而会生成很多无效的网址 这个要删掉

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
1866905838 初级会员 发表于 2017-3-14 14:07:47 | 只看该作者
HJLing 发表于 2017-3-14 10:29
第一级规则(艺术个人信息)和第二级规则(医生个人信息2)是层级关系 需要分开运行
即:既要手动去运行第一级 ...

感谢,你的回复解答我了疑惑,我懂了这个层级的原理。但是,我先又有了个关于

主题:艺术个人信息 的 一个问题?
问题如下:
我需要抓取“访问个人网站”下的网址,但是经过实际运行,我发现我抓取到的都是,“宋毅军”(即医生名字下的王网址)。

看过好多遍,内容映射的没啥问题。
另外需要说明的是,有的医生和面没有“访问个人网站”的连接。




还请大神给予解决~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
HJLing 版主 发表于 2017-3-14 14:14:38 | 只看该作者
1866905838 发表于 2017-3-14 14:07
感谢,你的回复解答我了疑惑,我懂了这个层级的原理。但是,我先又有了个关于

主题:艺术个人信息 [/bac ...


定位标志映射的节点找得不好 你之前使用blue 这个值跟医生名字的链接是同一个class值 要找唯一的值比如截图中的yy_jb_df

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
1866905838 初级会员 发表于 2017-3-14 19:58:33 | 只看该作者
HJLing 发表于 2017-3-14 14:14
定位标志映射的节点找得不好 你之前使用blue 这个值跟医生名字的链接是同一个class值 要找唯一的值比如 ...

感谢!帮助,会积极分享GooSeeker给我的朋友的~~
感谢!
举报 使用道具
6#
HJLing 版主 发表于 2017-3-15 09:43:07 | 只看该作者
1866905838 发表于 2017-3-14 19:58
感谢!帮助,会积极分享GooSeeker给我的朋友的~~
感谢!


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-4 20:00