26 40056

求问!!!!

WZXwzx 于 2019-7-9 18:21 发表 [复制链接]
求问大神!
知网上的每篇文章的作者数不同,每个作者的详细信息都需要点进链接才可以看到,用集搜客可以把每个作者的详细信息都抓取下来吗?如果可以的话要怎么做样例复制,怎么做下级线索呢?
谢谢大神!

举报 使用道具
| 回复

共 26 个关于本帖的回复 最后回复于 2019-7-14 07:47

Fuller 管理员 发表于 2019-7-10 15:28:18 | 显示全部楼层
有具体链接吗?
举报 使用道具
WZXwzx 初级会员 发表于 2019-7-10 16:19:13 | 显示全部楼层
Fuller 发表于 2019-7-10 15:28
有具体链接吗?

有!
http;//kns.cnki.net/kns/brief/resuit.aspx?dbprefix=CJFQ
就像这个页面,可以采集每一个作者的详情吗?
谢谢大神!

举报 使用道具
Fuller 管理员 发表于 2019-7-10 16:52:09 | 显示全部楼层
网页打不开。有个建议,如果要对某些局部的内容做样例复制,可以用嵌套整理箱
举报 使用道具
WZXwzx 初级会员 发表于 2019-7-10 19:41:23 | 显示全部楼层
Fuller 发表于 2019-7-10 16:52
网页打不开。有个建议,如果要对某些局部的内容做样例复制,可以用嵌套整理箱。 ...

不知道为什么既不能上传图片也不能复制网址上来,感觉和这个嵌套整理箱并不太一样
知网网页结构是类似这样的
标题a           作者1;作者2
标题b           作者1
标题c           作者1;作者2;作者3
.......................
作者的数量并没有规律,点进作者会有作者的详细介绍
想抓取每个作者的详细介绍
这样可以用集搜客抓取吗?要怎么做规则呢?

举报 使用道具
Fuller 管理员 发表于 2019-7-10 19:51:16 | 显示全部楼层
可以每一行是一个样例,进行样例复制,然后每一行里面有个小样例复制,每个作者是个小样例。
举报 使用道具
WZXwzx 初级会员 发表于 2019-7-10 21:10:43 | 显示全部楼层
Fuller 发表于 2019-7-10 19:51
可以每一行是一个样例,进行样例复制,然后每一行里面有个小样例复制,每个作者是个小样例。 ...

不知道您说的这个小样例复制怎么做呢?有没有具体教程呢?
我试着做了一下,因为第一行的作者是一个,对第一行做了样例复制之后,测试发现每一行都只能抓取到第一个作者
不知道应该要怎么做才能把其他行的第二三个作者抓取到。

举报 使用道具
Fuller 管理员 发表于 2019-7-11 10:44:26 | 显示全部楼层
WZXwzx 发表于 2019-7-10 21:10
不知道您说的这个小样例复制怎么做呢?有没有具体教程呢?
我试着做了一下,因为第一行的作者是一个,对 ...

两层20190711104222.png
比如这样,这是两层,外面代表一个网页上的更大范围,里面是小范围。层数不限。

在整理箱上,点击鼠标右键,可以看到移动菜单,便于把一个抓取内容变成另一个节点的子内容
举报 使用道具
WZXwzx 初级会员 发表于 2019-7-11 14:40:19 | 显示全部楼层
Fuller 发表于 2019-7-11 10:44
比如这样,这是两层,外面代表一个网页上的更大范围,里面是小范围。层数不限。

在整理箱上,点击鼠标 ...

您能不能帮我看一下我这个规则整体做的对不对,在那里出现了问题呢?一开始就 匹配失败了
规则名是“经营管理者8”“经营管理者8检索后”“经营管理者8作者详情”
谢谢您!!!!

举报 使用道具
Fuller 管理员 发表于 2019-7-11 14:50:25 | 显示全部楼层
WZXwzx 发表于 2019-7-11 14:40
您能不能帮我看一下我这个规则整体做的对不对,在那里出现了问题呢?一开始就 匹配失败了
规则名是“经营 ...

第一个步骤,你选了起点是43,你想选择哪个年份到哪个年份?

我怎么一个都搜不到
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 01:20