评论 lusiluo 2016-9-11 11:22
您好,我的按着教程制作的规则可以成功抓取到部分页面的信息,但也有相当一部分的页面抓取错误,显示规则不适用,请问这该怎么办呐?
评论 ym 2016-9-5 10:17
elegantcoin: 可以抓取到那些不能下载的文章吗?
这个教程是采集文章摘要信息,即使不能下载也是能采到其摘要的。
评论 Fuller 2016-9-5 10:15
elegantcoin: 可以抓取到那些不能下载的文章吗?
网络爬虫只是一个下载工具,前提是您需要有访问数据的权限,网络爬虫只提高下载和存储效率,但是它不能下载没有权限看的内容
评论 elegantcoin 2016-9-5 10:12
可以抓取到那些不能下载的文章吗?
评论 Fuller 2016-8-1 09:21
winter678: 规则二生成的EXCEL,改好网址之后的 怎么提供给规则三当线索?
在会员中心导入线索
评论 winter678 2016-7-31 16:54
规则二生成的EXCEL,改好网址之后的 怎么提供给规则三当线索?
评论 winter678 2016-7-31 16:48
winter678: 就是 我生成的EXCEL表比您的多一列  而且感觉您提供的公式是借助了J的前一列的数据 但是我的前一列数据没什么意义啊 就是 关键词UAV与检索 ...
借助批量替换不行吗?  用 "http://www.cnki.net/KCMS" 替换 "/kns"
评论 winter678 2016-7-31 16:45
winter678: “在单元格J2输入公式=&quot;<a href="http://www.cnki.net/KCMS&quot;&RIGHT(I2" target="_blank">http://www.cnki.net/KCMS&quot;&RIGHT(I2</a>,LEN(I2)-4)得到可访问的网址,并往下填充,这样得到的网址就可以批量添加作为第三个规则 ...
就是 我生成的EXCEL表比您的多一列  而且感觉您提供的公式是借助了J的前一列的数据 但是我的前一列数据没什么意义啊 就是 关键词UAV与检索
评论 winter678 2016-7-31 16:44
“在单元格J2输入公式="http://www.cnki.net/KCMS"&RIGHT(I2,LEN(I2)-4)得到可访问的网址,并往下填充,这样得到的网址就可以批量添加作为第三个规则的线索。”   首先 我生成的表  是J的下一列  怎么回事? 其次 如果我把第一列删了为了和您的对应 公式填充之后 显示的是http://www.cnki.net/KCMS+-检 索 这个不对吧? 也就是我的I行是 UAV-+-检 索(关键字UAV)
评论 Fuller 2016-7-31 14:24
winter678: ???
分成多级抓取,每一级都有一个规则
评论 winter678 2016-7-31 09:33
winter678: 第二个规则是在第一个主题下 继续新建一个规则吗?
???
评论 Fuller 2016-7-31 09:04
winter678: 我做第一规则的第一步时候 怎么没有像楼主那样的 定为标志NaviDBSwitch  和类型+class 啊? 这个是怎么添加上的? 有影响吗? ...
定位标志映射参看这篇文章:http://www.gooseeker.com/doc/article-120-1.html ,更多文章在教程板块,定位标志的文章是在中级教程-〉批量翻页采集-〉定位标志
评论 winter678 2016-7-31 08:58
第二个规则是在第一个主题下 继续新建一个规则吗?
评论 winter678 2016-7-31 08:39
我做第一规则的第一步时候 怎么没有像楼主那样的 定为标志NaviDBSwitch  和类型+class 啊? 这个是怎么添加上的? 有影响吗?
评论 Fuller 2016-6-15 16:08
keithkang: 第3个和第4个规则如何与前两个规则发生联系呢?
2级和3级之间是层级抓取,2级运行的时候,为3级生成线索
评论 keithkang 2016-6-15 15:39
ym: 教程里是直接做数据映射,不是样例复制
第3个和第4个规则如何与前两个规则发生联系呢?
评论 ym 2016-6-15 15:34
keithkang: 第4个规则知网_文章数据只有一个页面怎么做样例复制?
教程里是直接做数据映射,不是样例复制
评论 keithkang 2016-6-15 15:27
第4个规则知网_文章数据只有一个页面怎么做样例复制?
评论 Fuller 2016-6-12 18:51
keithkang: 抓取时要输入验证码怎么办?
抓的太多太快了,遇到验证码只能自己手工输入
评论 keithkang 2016-6-12 18:48
抓取时要输入验证码怎么办?
评论 Fuller 2015-12-12 23:41
525315809: 可以抓取到那些不能下载的文章吗?
这些文章我们下载不了,有账号才行,如果有下载账号,可以用GooSeeker进行下载
评论 525315809 2015-12-12 22:58
可以抓取到那些不能下载的文章吗?
12

GMT+8, 2024-4-27 17:09