31#
15829531503 新手上路 发表于 2020-6-27 22:44:46 | 只看该作者
https://www.zhihu.com/topic/20086204/top-answers 请问大家都成功了吗?我这个一直爬不出来,给的样本网址也爬不出来。
举报 使用道具
32#
Fuller 管理员 发表于 2020-6-27 23:02:17 | 只看该作者
15829531503 发表于 2020-6-27 22:44
https://www.zhihu.com/topic/20086204/top-answers 请问大家都成功了吗?我这个一直爬不出来,给的样本网 ...

你这个网址不是这个快捷采集的,而是那个“精华”的,下面3个版块对应3个不同的快捷采集工具



举报 使用道具
33#
15829531503 新手上路 发表于 2020-6-28 20:48:31 | 只看该作者
Fuller 发表于 2020-6-27 23:02
你这个网址不是这个快捷采集的,而是那个“精华”的,下面3个版块对应3个不同的快捷采集工具

好的,我下图是用了“精华”的选项,复制了示例的网址,还是显示抓取失败,能否看看是我哪里有问题?太感谢了!

举报 使用道具
34#
Fuller 管理员 发表于 2020-6-28 22:42:02 | 只看该作者
15829531503 发表于 2020-6-28 20:48
好的,我下图是用了“精华”的选项,复制了示例的网址,还是显示抓取失败,能否看看是我哪里有问题?太感 ...

最新版的数据管家是1.6.2 ,今天发现采集知乎的网站有问题,只能采集第一屏的内容。明天会修复以后出一个新版本1.6.4,这个期间可以运行集搜客爬虫浏览器采集知乎网站。
举报 使用道具
35#
15829531503 新手上路 发表于 2020-6-28 22:48:35 | 只看该作者
Fuller 发表于 2020-6-28 22:42
最新版的数据管家是1.6.2 ,今天发现采集知乎的网站有问题,只能采集第一屏的内容。明天会修复以后出一个 ...

好的,明天试用下,谢谢!
举报 使用道具
36#
Fuller 管理员 发表于 2020-6-29 11:13:48 | 只看该作者
15829531503 发表于 2020-6-28 22:48
好的,明天试用下,谢谢!

刚刚发布了一个内测版,还没有放在网站上供下载,你可以在集搜客的qq群里面问管理员要
举报 使用道具
37#
QEmyHEART 初级会员 发表于 2021-4-23 01:06:38 | 只看该作者
我尝试用知乎动态采集采集这个话题下的所有讨论内容 但是不知道为什么总是向下加载着加载着就突然不再加载了 然后显示已经采集结束 但肯定没有采集完 https://www.zhihu.com/topic/19561734/hot
另外 打包数据时发现显示的是本次可打包0条数据 也就是其实根本没有爬到
我已经看了该楼下的所有帖子 你们之前提到的 登录账号、最大化屏幕、选择全部页面 都已经排除了,不是这些问题
(顺便一提 我是win10)
举报 使用道具
38#
Fuller 管理员 发表于 2021-4-23 11:49:14 | 只看该作者
QEmyHEART 发表于 2021-4-23 01:06
我尝试用知乎动态采集采集这个话题下的所有讨论内容 但是不知道为什么总是向下加载着加载着就突然不再加载 ...

清缓存,然后下载安装最新版的数据管家,试试
举报 使用道具
39#
QEmyHEART 初级会员 发表于 2021-4-23 14:23:33 | 只看该作者
Fuller 发表于 2021-4-23 11:49
清缓存,然后下载安装最新版的数据管家,试试

我尝试了清除缓存以及使用最新版的数据管家 但依然会显示采集结束并且只有0条数据可以打包
举报 使用道具
40#
scraper 论坛元老 发表于 2021-4-23 15:21:28 | 只看该作者
QEmyHEART 发表于 2021-4-23 14:23
我尝试了清除缓存以及使用最新版的数据管家 但依然会显示采集结束并且只有0条数据可以打包 ...

我们检查一下
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 07:51