快捷导航
需要 以下的内容:
微博用户数据
序号字段名标识符
1用户IDuserID
2地址adress
3性别gender
4创建时间creationT
5签到时间checkT
6签到点IDpoiid
微博用户签到数据
序号字段名标识符
1用户IDuserID
2地点location
3性别gender
4年龄age
5经度x
6纬度y
7日期date
8时间time
9签到时间checkinTime
10签到点IDpoiid

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2020-2-22 19:16

wangyong 版主 发表于 2019-11-26 19:00:38 | 显示全部楼层
采集微博数首先要找到有显示这些数据的微博板块
举报 使用道具
Fuller 管理员 发表于 2019-11-26 22:15:43 | 显示全部楼层
最近采集微博签到信息的很多,难道有什么研究课题?
最容易实现的采集方案是:
1,先选定好签到景点,进入这个景点的网页,翻页采集所有签到人的网址
2,把所有博主的网址导入采集博主信息的工具(https://www.gooseeker.com/res/softdetail_8.html ),采集他的基本资料。
举报 使用道具
Fuller 管理员 发表于 2020-2-22 19:16:50 | 显示全部楼层
已经上线了4个微博签到数据的快捷采集,不用做规则,直接使用:
1,微博签到采集_主页
2,微博签到采集_探索此地
3,微博签到采集_此地热议
4,微博签到采集_来过此地的人

用这些工具把微博数据采集下来以后,可以把里面的地址信息找出来,然后再在百度地图api上翻译成经纬度。

找的过程中,可以手工找,手工去查百度得到经纬度。如果数量很大,那就要写一个程序翻译经纬度,或者委托我们做处理
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 数据管家和集搜客网络爬虫超出配额是怎么回
  • 用GooSeeker数据管家能采集微博内容吗?
  • 怎样使用GooSeeker数据管家启动采集任务?
  • GooSeeker数据管家软件使用指导
  • 如何使用集搜客分词平台做社会网络图分析?

热门用户

GMT+8, 2020-9-20 09:32