第一个网页结构技术让两个整理箱抓取数据,第二个网页结构技术让用层级抓取,第一个规采取不到第二个网页结构的数据,第二个规则采取不到第一个网页结构的数据

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2018-4-19 14:34

沙发
yangwenge 金牌会员 发表于 2018-4-19 11:53:22 | 只看该作者
本帖最后由 yangwenge 于 2018-4-19 12:05 编辑

没明白你要表达什么意思

前面已经告诉过你用层级采集,需要用下面的@src中的链接做规则,加载你的规则还是用的上面的网址,那肯定会匹配失败。
另外需要注意规则的适用性,随便加载失败线索的链接就会发现div的@class不相同,那么映射直接映射dody节点不就可以了?


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
板凳
pay123456 初级会员 发表于 2018-4-19 14:18:35 | 只看该作者
我就是用的下面的@src中的链接做的规则好嘛,拿到src下面链接地址的规则是科技政策汇项目详情,然后下级规则就是我要拿到文章内容的规则是:科技政策汇文章内容,然后我运行科技政策汇文章内容规则时候报错
举报 使用道具
地板
pay123456 初级会员 发表于 2018-4-19 14:34:24 | 只看该作者
yangwenge 发表于 2018-4-19 11:53
没明白你要表达什么意思

前面已经告诉过你用层级采集,需要用下面的@src中的链接做规则,加载你的规则还是 ...

我就是用的下面的@src中的链接做的规则好嘛,拿到src下面链接地址的规则是科技政策汇项目详情,然后下级规则就是我要拿到文章内容的规则是:科技政策汇文章内容,然后我运行科技政策汇文章内容规则时候报错            
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-7 01:01