11#
shixiaooooo 新手上路 发表于 2017-12-28 15:25:22 | 只看该作者
何波波 发表于 2017-12-28 14:38
你加的是什么链接?

excel表格上能看到链接阿,fullpath 以及realpath列

举报 使用道具
12#
wangyong 版主 发表于 2017-12-28 15:48:40 | 只看该作者
把你采集遇到失败的链接发一下
举报 使用道具
13#
shixiaooooo 新手上路 发表于 2017-12-28 20:24:23 | 只看该作者
wangyong 发表于 2017-12-28 15:48
把你采集遇到失败的链接发一下

https://www.zhihu.com/people/lang-gan-14/answers
https://www.zhihu.com/people/luo-rui-92/answers
试了这两个都不行

举报 使用道具
14#
HJLing 版主 发表于 2017-12-29 10:12:03 | 只看该作者
shixiaooooo 发表于 2017-12-28 14:01
【抓取提问列表】刚有再尝试一下没有问题,但是这个回答列表采集还是有些问题的喔
...

这个问题是因为知乎问题列表的网页结构发生了一点点变化,已经修改过来了。现在可以重新运行采集。
举报 使用道具
15#
shixiaooooo 新手上路 发表于 2017-12-29 16:23:33 | 只看该作者
HJLing 发表于 2017-12-29 10:12
这个问题是因为知乎问题列表的网页结构发生了一点点变化,已经修改过来了。现在可以重新运行采集。
...

OK 十分感谢!下周再使用看看!

举报 使用道具
16#
shixj1 新手上路 发表于 2018-10-6 04:38:14 | 只看该作者
336条回答,只提取到了296条数据,不知道哪些丢了。

链接:https://www.zhihu.com/people/po-miao-miao-zhu/answers
举报 使用道具
17#
Fuller 管理员 发表于 2018-10-6 09:42:55 | 只看该作者
shixj1 发表于 2018-10-6 04:38
336条回答,只提取到了296条数据,不知道哪些丢了。

链接:https://www.zhihu.com/people/po-miao-miao-zh ...

如果有丢的,都是一些特殊样式的,比如,没有人回答的问题,比较容易看出来。可以对照一下找找
举报 使用道具
18#
Joshu_acoustic 新手上路 发表于 2023-3-21 23:07:43 | 只看该作者
请问赞同人数为什么采集不出来了
举报 使用道具
19#
Fuller 管理员 发表于 2023-3-22 09:00:41 | 只看该作者
Joshu_acoustic 发表于 2023-3-21 23:07
请问赞同人数为什么采集不出来了

知乎_他的所有回答列表采集这个工具维护好了,可以采集到赞同人数了。你再试试。
举报 使用道具
20#
Joshu_acoustic 新手上路 发表于 2023-3-25 21:07:35 | 只看该作者
请问怎么才能够获取到回答内容的全部内容呀。我的意思是阅读全文展开后的内容。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 22:30