11#
bowieD 金牌会员 发表于 2018-5-2 15:31:07 | 只看该作者
lsckyj 发表于 2018-5-2 15:25
我试了一下,还是不行,是不是在豆瓣上面只能爬200多条

根据“小猪佩奇”这个主题名搜索不到你的规则,首先观察一下一共有多少条数据,只爬了200多条应该是翻页到某一页,采集的关键内容就定位不到就报错中断了,采集的时候观察一下在哪一页中断了,再根据Fuller所说的方法检查和调整内容映射。
举报 使用道具
12#
lsckyj 初级会员 发表于 2018-5-2 20:11:15 | 只看该作者
E:\
举报 使用道具
13#
lsckyj 初级会员 发表于 2018-5-2 20:12:39 | 只看该作者
E:\
我没用小猪佩奇啦,用的是红海行动。不行,都想放弃啦
举报 使用道具
14#
lsckyj 初级会员 发表于 2018-5-2 20:14:41 | 只看该作者
图片

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
15#
bowieD 金牌会员 发表于 2018-5-2 20:40:52 | 只看该作者
本帖最后由 bowieD 于 2018-5-2 20:42 编辑

1、你的样例复制有问题,你的样例节点选择的是第一个和第四个,所以会采集不全,应该选择第一个样例节点和第二个样例节点来做样例复制

另外需要把定位方式改成绝对定位


2、豆瓣短评有数据diy可以使用,直接添加结构相同的网址进入就能采集
《豆瓣_电影短评》

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-9 21:41