151#
Three_Blank 初级会员 发表于 2016-5-30 19:32:44 | 只看该作者
Fuller 发表于 2016-5-30 17:35
是那个工具的?你确定已经有数据采集到了吗?选中那个任务,如果有数据就能在界面直接看到新数据。 ...

好了,可以了,谢谢啦
举报 使用道具
152#
Three_Blank 初级会员 发表于 2016-6-1 16:20:51 | 只看该作者
xandy 发表于 2016-3-1 11:00
在使用过程中有问题可以在本帖留言~~~

我这边一直不能打包数据,采集任务过好久就采集完成了,打包数据还是灰色的,不能点击,上一次出现这个问题,采集到20条数据,过了四五个小时就可以打包了,这次采集的数据可能比较多就一直不能打包,下面的示例数据也不能显示,我抓取的是16年5月2号的数据
举报 使用道具
153#
Fuller 管理员 发表于 2016-6-1 17:47:19 | 只看该作者
Three_Blank 发表于 2016-6-1 16:20
我这边一直不能打包数据,采集任务过好久就采集完成了,打包数据还是灰色的,不能点击,上一次出现这个问 ...

根据上次问题解决经验,你应该修改一下登录时所用的账号,你的账号还有大写字母,是大写的一定要大写。建议你用准确的大小写重新登录一下系统,还有爬虫的账号管理那里要重新设置一下,要用准确的大小写。这些设置好以后,重新登录和运行爬虫软件。

这些做好以后,重新添加任务

这个程序bug会在后续版本进行修改,目前需要你输入账号的时候准确使用大小写
举报 使用道具
154#
Three_Blank 初级会员 发表于 2016-6-1 20:53:02 | 只看该作者
Fuller 发表于 2016-6-1 17:47
根据上次问题解决经验,你应该修改一下登录时所用的账号,你的账号还有大写字母,是大写的一定要大写。建 ...

已经解决了,谢谢
举报 使用道具
155#
fishhaichun 高级会员 发表于 2016-6-1 23:32:11 | 只看该作者
这个应用算是给用大数据写论文的同学们的福利吧。要是能够给特定博主主页设定关键字就好了。我现在用的就是笨办法,先爬下来,再自己手动挑
举报 使用道具
156#
Fuller 管理员 发表于 2016-6-1 23:53:43 | 只看该作者
fishhaichun 发表于 2016-6-1 23:32
这个应用算是给用大数据写论文的同学们的福利吧。要是能够给特定博主主页设定关键字就好了。我现在用的就是 ...

用excel的过滤功能吧
举报 使用道具
157#
fishhaichun 高级会员 发表于 2016-6-2 22:27:56 | 只看该作者
Fuller 发表于 2016-6-1 23:53
用excel的过滤功能吧

原来也只好是这样。不过已经是帮了很大的忙了。原来还在啃python,找到这个应用总算数据有眉目了
举报 使用道具
158#
xandy 论坛元老 发表于 2016-6-3 09:50:46 | 只看该作者
fishhaichun 发表于 2016-6-2 22:27
原来也只好是这样。不过已经是帮了很大的忙了。原来还在啃python,找到这个应用总算数据有眉目了 ...

我们最近发起来一个python开源项目,有兴趣的话可以了解一下
举报 使用道具
159#
fishhaichun 高级会员 发表于 2016-6-3 14:03:45 | 只看该作者
xandy 发表于 2016-6-3 09:50
我们最近发起来一个python开源项目,有兴趣的话可以了解一下

谢谢介绍,我也正想跟大家多学习呢
举报 使用道具
160#
风景不在对岸 初级会员 发表于 2016-6-13 22:07:34 | 只看该作者
你好,我想请教几个问题,1.存在采集数据的时候中断,表示没人转发,问是否转发,但是不显示第几页了,请问你的这个是怎么处理的。2.为什么作为样本的线索可以进行采集,添加的其他线索不可以?谢谢指教~
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 14:50