11#
Fuller 管理员 发表于 2019-11-11 15:48:19 | 只看该作者
数据爬呀爬 发表于 2019-11-11 15:34
我就是从微博总采集入口进去的,然后使用了微博博主主页内容进行采集,但是采集完了数据还是xml格式,也 ...

本地的xml格式是没有转换的数据,转换后的数据要到类似我上面截图的那样的界面,不过你要进入到博主主页或者博主详细资料页面(你是用的哪一个?),在那里才能找到采集任务并下载数据。微博采集工具的任务没有在会员中心那里管理,这是与其他快捷采集不同的
举报 使用道具
12#
数据爬呀爬 初级会员 发表于 2019-11-11 15:55:48 | 只看该作者
我是在采集博主详细信息时采集的数据下载之后还是xml格式,那么怎么才能转换为excel格式呢?还有一个问题就是如果我需要采集许多博主的详细信息,那么在这之前我怎么才能把所有博主的主页链接采集完全呢,难道要找到博主然后一个个点进去复制主页链接吗
举报 使用道具
13#
Fuller 管理员 发表于 2019-11-11 16:19:00 | 只看该作者
数据爬呀爬 发表于 2019-11-11 15:55
我是在采集博主详细信息时采集的数据下载之后还是xml格式,那么怎么才能转换为excel格式呢?还有一个问题就 ...

采集签到页面是自定义规则?采集完成后,在会员中心导出数据,就是excel格式了,如果没有设置自动的爬虫群模式,那么不会自动转换的,要先导入后导出,导入的时候,把所有xml文件压缩成zip再导入,参看下面截图,教程:https://www.gooseeker.com/doc/article-329-1.html



导出excel以后,在excel中选中博主网址那一列,拷贝出来,添加到采集博主详细资料的任务中



举报 使用道具
14#
数据爬呀爬 初级会员 发表于 2019-11-11 18:25:06 | 只看该作者
嗯嗯好的,我知道了,非常感谢
举报 使用道具
15#
Fuller 管理员 发表于 2020-2-22 19:15:23 | 只看该作者
数据爬呀爬 发表于 2019-11-11 18:25
嗯嗯好的,我知道了,非常感谢

已经上线了4个微博签到数据的快捷采集,不用做规则,直接使用:
1,微博签到采集_主页
2,微博签到采集_探索此地
3,微博签到采集_此地热议
4,微博签到采集_来过此地的人

用这些工具把微博数据采集下来以后,可以把里面的地址信息找出来,然后再在百度地图api上翻译成经纬度。

找的过程中,可以手工找,手工去查百度得到经纬度。如果数量很大,那就要写一个程序翻译经纬度,或者委托我们做处理
举报 使用道具
16#
wangyong 版主 发表于 2021-3-10 15:41:17 | 只看该作者
使用集搜客快捷采集中的微博签到采集_此地热议可以采集到具体地点的签到数据

数据管家左侧工具栏进入快捷采集,选择微博签到采集_此地热议输入签到地点链接
例如要采集青岛的签到数据则输入:https://weibo.com/p/1001018008637020000000000
在微博高级搜索中输入要搜索的地点名称,选择包含短网址条件,可以找到对应签到地的网址


输入要采集的地点网址后,数据管家会同时启动采集任务
待数据采集已完成后,在快捷采集管理页面,即可打包下载Excel格式的数据

如果需要设置定时采集,比如每五分钟采集一次更新数据,可以购买VIP版来设置

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 00:40