https://www.allhistory.com/detail/582bd7e305c3fba858030577
这个网址在谋数台的浏览器中打不开,导致之前根据这个网页的结构定义的抓取规则全部失效,但是以前在谋数台是能打开这个网页的。这是为什么?


举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2020-3-18 09:10

Fuller 管理员 发表于 2020-3-18 00:30:07 | 显示全部楼层
规则名字是什么?我可以帮你看一下规则里面用了哪些动作类型。如果只是内容采集、翻页和点击,那么用新版的集搜客采摘浏览器进行采集,规则是通用的,直接运行就行。
运行规则和定义规则的方法参照《阿里巴巴外包询价网站的采集方法

举报 使用道具
rockmen1 初级会员 发表于 2020-3-18 00:31:12 | 显示全部楼层
规则名是


二级页面_艺术家详情
举报 使用道具
rockmen1 初级会员 发表于 2020-3-18 00:32:47 | 显示全部楼层
Fuller 发表于 2020-3-18 00:30
规则名字是什么?我可以帮你看一下规则里面用了哪些动作类型。如果只是内容采集、翻页和点击,那么用新版的 ...

规则名是

二级页面_艺术家详情

举报 使用道具
rockmen1 初级会员 发表于 2020-3-18 00:37:38 | 显示全部楼层
刚下载了集搜客采摘浏览器,安装后这个浏览器能打开这个网页
举报 使用道具
Fuller 管理员 发表于 2020-3-18 00:45:15 | 显示全部楼层
rockmen1 发表于 2020-3-18 00:32
规则名是

二级页面_艺术家详情

这个规则好复杂,用集搜客采摘浏览器直接运行一下试试吧。

这个规则有没有下载图片?采摘浏览器目前下载不了图片
举报 使用道具
rockmen1 初级会员 发表于 2020-3-18 01:09:08 | 显示全部楼层
正在试,但状态一直都是滚屏中,已经有五六分钟了
举报 使用道具
Fuller 管理员 发表于 2020-3-18 09:10:52 | 显示全部楼层
rockmen1 发表于 2020-3-18 01:09
正在试,但状态一直都是滚屏中,已经有五六分钟了

配置20200318091004.png
点击这里,进入配置界面,看看这里显示滚屏次数是多少
配置20200318091004.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 18:46