本帖最后由 jaguarzls 于 2017-8-8 23:30 编辑
本人参考往期培训《【24】连续动作采集知网文献》、《【34】知网精确采集1》和《【35】知网精确采集2》定义规则一和规则二,用于搜集知网主题名为“纳税人满意度”的所有作者、单位、发表时间等信息。按照理论上来说,加上主题名后的,应该是289篇,但实际用规则去爬取的时候,却是7100多万篇,也就是与不加主题名结果一样。
为再次检查我制定的规则是否有误,我特意在论坛里买了知网搜索的几个规则(知网_搜索62399、知网_搜索结果62399、知网_文章数据更多62399、知网_文章数据62399、知网162399和知网262399),对比一下,和我制定的没有差别,运行结果也是一样,加不加关键词没有作用,也就是说连续动作失效。
在此,向群里的大牛赐教,还望指点迷津。
文末附上截图(前四张是知网搜索RULE1和两张是知网搜索RULE2):
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
|
|
|
共 12 个关于本帖的回复 最后回复于 2017-8-9 15:32