快捷导航
本帖最后由 Mu_shui_GS2020 于 2020-3-30 23:43 编辑

主题名叫:新豆瓣电影数据分析-短评
希望大家能帮一下忙,谢谢了

问题:只能采集一种星级信息,其他的星级信息在测试后发现采集位置都是空的

如图

如图
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2020-3-31 11:06

Fuller 管理员 发表于 2020-3-31 00:03:01 | 显示全部楼层
加载你的规则失败了,从提示信息看,不同星级都有不同的class,如果规则使用了5星级的class,那么只能抓取5星级的。我看看怎样修改

规则20200331000140.png
举报 使用道具
Fuller 管理员 发表于 2020-3-31 00:07:32 | 显示全部楼层
内容20200331000458.png

用最下面那个箭头指向的节点做内容映射,用倒数第二个箭头指向的节点做定位标志映射,就能跳过@class='allstar40 rating'。其他内容也可以用上定位标志映射,提高规则的适应性。定位标志映射的教程是:《定位标志映射精确采集范围
举报 使用道具
Mu_shui_GS2020 初级会员 发表于 2020-3-31 11:00:58 | 显示全部楼层
好的,谢谢你,捂脸,我还没没试过运行,之前只是测试,汗,我去试一下,谢谢你
举报 使用道具
Mu_shui_GS2020 初级会员 发表于 2020-3-31 11:06:26 | 显示全部楼层
Fuller 发表于 2020-3-31 00:07
用最下面那个箭头指向的节点做内容映射,用倒数第二个箭头指向的节点做定位标志映射,就能跳过@class='al ...

真的谢谢你,已经可以了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 如何使用集搜客分词平台做社会网络图分析?
  • 关于食品安全的美国联邦法规文件的网络爬虫
  • 怎样更有效率地搜索互联网和整理知识—使用
  • 阿里巴巴外包询价网站用集搜客网络爬虫能采
  • 在限定论域的时候,为什么“任何一个”表示

热门用户

GMT+8, 2020-5-27 04:08