求问大神!
知网上的每篇文章的作者数不同,每个作者的详细信息都需要点进链接才可以看到,用集搜客可以把每个作者的详细信息都抓取下来吗?如果可以的话要怎么做样例复制,怎么做下级线索呢?
谢谢大神!

举报 使用道具
| 回复

共 26 个关于本帖的回复 最后回复于 2019-7-14 07:47

沙发
Fuller 管理员 发表于 2019-7-10 15:28:18 | 只看该作者
有具体链接吗?
举报 使用道具
板凳
WZXwzx 初级会员 发表于 2019-7-10 16:19:13 | 只看该作者
Fuller 发表于 2019-7-10 15:28
有具体链接吗?

有!
http;//kns.cnki.net/kns/brief/resuit.aspx?dbprefix=CJFQ
就像这个页面,可以采集每一个作者的详情吗?
谢谢大神!

举报 使用道具
地板
Fuller 管理员 发表于 2019-7-10 16:52:09 | 只看该作者
网页打不开。有个建议,如果要对某些局部的内容做样例复制,可以用嵌套整理箱
举报 使用道具
5#
WZXwzx 初级会员 发表于 2019-7-10 19:41:23 | 只看该作者
Fuller 发表于 2019-7-10 16:52
网页打不开。有个建议,如果要对某些局部的内容做样例复制,可以用嵌套整理箱。 ...

不知道为什么既不能上传图片也不能复制网址上来,感觉和这个嵌套整理箱并不太一样
知网网页结构是类似这样的
标题a           作者1;作者2
标题b           作者1
标题c           作者1;作者2;作者3
.......................
作者的数量并没有规律,点进作者会有作者的详细介绍
想抓取每个作者的详细介绍
这样可以用集搜客抓取吗?要怎么做规则呢?

举报 使用道具
6#
Fuller 管理员 发表于 2019-7-10 19:51:16 | 只看该作者
可以每一行是一个样例,进行样例复制,然后每一行里面有个小样例复制,每个作者是个小样例。
举报 使用道具
7#
WZXwzx 初级会员 发表于 2019-7-10 21:10:43 | 只看该作者
Fuller 发表于 2019-7-10 19:51
可以每一行是一个样例,进行样例复制,然后每一行里面有个小样例复制,每个作者是个小样例。 ...

不知道您说的这个小样例复制怎么做呢?有没有具体教程呢?
我试着做了一下,因为第一行的作者是一个,对第一行做了样例复制之后,测试发现每一行都只能抓取到第一个作者
不知道应该要怎么做才能把其他行的第二三个作者抓取到。

举报 使用道具
8#
Fuller 管理员 发表于 2019-7-11 10:44:26 | 只看该作者
WZXwzx 发表于 2019-7-10 21:10
不知道您说的这个小样例复制怎么做呢?有没有具体教程呢?
我试着做了一下,因为第一行的作者是一个,对 ...


比如这样,这是两层,外面代表一个网页上的更大范围,里面是小范围。层数不限。

在整理箱上,点击鼠标右键,可以看到移动菜单,便于把一个抓取内容变成另一个节点的子内容

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
9#
WZXwzx 初级会员 发表于 2019-7-11 14:40:19 | 只看该作者
Fuller 发表于 2019-7-11 10:44
比如这样,这是两层,外面代表一个网页上的更大范围,里面是小范围。层数不限。

在整理箱上,点击鼠标 ...

您能不能帮我看一下我这个规则整体做的对不对,在那里出现了问题呢?一开始就 匹配失败了
规则名是“经营管理者8”“经营管理者8检索后”“经营管理者8作者详情”
谢谢您!!!!

举报 使用道具
10#
Fuller 管理员 发表于 2019-7-11 14:50:25 | 只看该作者
WZXwzx 发表于 2019-7-11 14:40
您能不能帮我看一下我这个规则整体做的对不对,在那里出现了问题呢?一开始就 匹配失败了
规则名是“经营 ...

第一个步骤,你选了起点是43,你想选择哪个年份到哪个年份?

我怎么一个都搜不到
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-6 09:26