691#
Fuller 管理员 发表于 2018-5-31 17:38:55 | 只看该作者
wangsihan19970113 发表于 2018-5-31 17:35
点击采集运行,跳出爬虫窗口,但一直显示空白……也没有运行的痕迹

用的哪个工具?
举报 使用道具
692#
Fuller 管理员 发表于 2018-5-31 18:41:04 | 只看该作者
wangsihan19970113 发表于 2018-5-31 17:35
点击采集运行,跳出爬虫窗口,但一直显示空白……也没有运行的痕迹

不好意思,程序升级出现了问题。我们正在修正。19点前就能恢复
举报 使用道具
693#
whuhzx 中级会员 发表于 2018-6-11 17:25:36 | 只看该作者
Fuller 发表于 2018-5-31 18:41
不好意思,程序升级出现了问题。我们正在修正。19点前就能恢复

请问程序已经修复了吗?我用 mac 版的软件无法爬取「微博博主详细资料采集工具」,启动爬虫后一直没有反应,看底部好像是「抓取规则服务器」和」「爬虫线索服务器」没有连接成功,但是我用其它规则进行爬取是可以连接成功的。感谢~
举报 使用道具
694#
Fuller_test_20180611 新手上路 发表于 2018-6-11 17:53:50 | 只看该作者
whuhzx 发表于 2018-6-11 17:25
请问程序已经修复了吗?我用 mac 版的软件无法爬取「微博博主详细资料采集工具」,启动爬虫后一直没有反 ...

爬虫连不上服务器的话,基本上可以判断是跟https的通信有关。这样检查:
1,在爬虫软件上选择菜单 配置-》账号管理,检查输入的账号和密码是否正确
2,点击“重选服务器”,看到的服务器地址是什么?
3,如果看到的服务器地址是空的,或者看到的是 http://www.gooseeker.com ,那么就修改成 https://www.gooseeker.com
4,如果看到的服务器地址是https://www.gooseeker.com ,那么请做一个检查,在爬虫浏览器上加载 https://www.gooseeker.com 网页,是否能够看到网页内容。
4.1,如果提示说证书无效,可能是您的电脑很久没有升级操作系统,那么请选择添加例外
4.2,如果https://www.gooseeker.com 能看到网页内容,说明 https通信没有问题,那么就是账号和密码不对

举报 使用道具
695#
whuhzx 中级会员 发表于 2018-6-11 19:31:39 | 只看该作者
Fuller_test_20180611 发表于 2018-6-11 17:53
爬虫连不上服务器的话,基本上可以判断是跟https的通信有关。这样检查:
1,在爬虫软件上选择菜单 配置- ...

已解决,感谢!
举报 使用道具
696#
summer05 新手上路 发表于 2018-6-15 14:31:21 | 只看该作者
可以显示每条微博发布的坐标吗
举报 使用道具
697#
aivykkk 新手上路 发表于 2018-6-20 19:39:02 | 只看该作者
你好,请问为何采集成功后打包数据,显示数据打包成功,可是点开数据下载并没有数据
举报 使用道具
698#
maomao 论坛元老 发表于 2018-6-20 19:56:23 | 只看该作者
aivykkk 发表于 2018-6-20 19:39
你好,请问为何采集成功后打包数据,显示数据打包成功,可是点开数据下载并没有数据 ...

具体是哪个微博工具?
举报 使用道具
699#
aivykkk 新手上路 发表于 2018-6-20 20:57:36 | 只看该作者
maomao 发表于 2018-6-20 19:56
具体是哪个微博工具?

关键词搜索
举报 使用道具
700#
maomao 论坛元老 发表于 2018-6-20 22:42:01 | 只看该作者

从后台看,你每次采集都有数据的。我建议你这样做检查:
1,下载数据的时候是不是用了下载工具,比如,迅雷?这样的下载工具很多时候处理不了网页上的程序,请使用浏览器自身的下载功能。
2,你访问集搜客网站是的时候用的是http还是https?如果网络环境不太好,或者是从国外访问,请用https网址,即,https://www.gooseeker.com ,从这里登录会员中心并且进入微博工具箱。https将更加稳定
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 17:13