两个问题:一是,修改任务时,按要求分析页面,但经常出现 “列表.链接: 生成规则的时候,发现没有对应到网页上的内容” 的问题;二是,百度资讯无法翻页抓取,设置了偏好class或者偏好id,

举报 使用道具
| 回复

共 35 个关于本帖的回复 最后回复于 2021-10-29 19:14

Fuller 管理员 发表于 2021-10-29 09:08:43 | 显示全部楼层
任务名是什么?发出来名字,我加载分析一下
举报 使用道具
15022411694 新手上路 发表于 2021-10-29 09:51:11 | 显示全部楼层
Fuller 发表于 2021-10-29 09:08
任务名是什么?发出来名字,我加载分析一下

戴厚良环境一级抓取
举报 使用道具
内容分析应用 金牌会员 发表于 2021-10-29 10:07:42 | 显示全部楼层
15022411694 发表于 2021-10-29 09:51
戴厚良环境一级抓取

是不是名字写错了,加载这个任务提示不存在
举报 使用道具
15022411694 新手上路 发表于 2021-10-29 10:15:18 | 显示全部楼层
内容分析应用 发表于 2021-10-29 10:07
是不是名字写错了,加载这个任务提示不存在

又重新做了一遍,名称改为了lilytest1, 但还是不可以
举报 使用道具
wangyong 版主 发表于 2021-10-29 10:57:37 | 显示全部楼层
15022411694 发表于 2021-10-29 10:15
又重新做了一遍,名称改为了lilytest1, 但还是不可以

这个规则加载直接全部报错了,问题应该是做规则的时候没有全部对第一条新闻做标注,标注时要都在第一条新闻上标注

举报 使用道具
15022411694 新手上路 发表于 2021-10-29 11:04:26 | 显示全部楼层
wangyong 发表于 2021-10-29 10:57
这个规则加载直接全部报错了,问题应该是做规则的时候没有全部对第一条新闻做标注,标注时要都在第一条新 ...

是对第一条新闻做的标注,不知道问题在哪里
举报 使用道具
wangyong 版主 发表于 2021-10-29 11:33:35 | 显示全部楼层
15022411694 发表于 2021-10-29 11:04
是对第一条新闻做的标注,不知道问题在哪里

你重新标注一遍,我按照正常流程操作了一次没有出现问题,软件是什么时候下载的
举报 使用道具
Fuller 管理员 发表于 2021-10-29 11:33:36 | 显示全部楼层
15022411694 发表于 2021-10-29 11:04
是对第一条新闻做的标注,不知道问题在哪里

给整个整理箱(也就是整理箱中的list节点)做上定位映射,因为每一条新闻都有相同的class,但是不同的id,所以,双击“list”,设置定位标志选用class

用定位标志采集列表数据的教程是:https://www.gooseeker.com/doc/article-533-1.html

做了定位映射以后,下次加载规则的时候,精确度会提高,不容易失败

定位30.png
举报 使用道具
15022411694 新手上路 发表于 2021-10-29 13:04:05 | 显示全部楼层
还是没有用,并且在修改任务时,按照要求加在规则,分析页面,就会出现如图所示的情况, 屏幕快照 2021-10-29 上午11.41.59.jpg
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 16:10