需要 以下的内容:
微博用户数据
序号字段名标识符
1用户IDuserID
2地址adress
3性别gender
4创建时间creationT
5签到时间checkT
6签到点IDpoiid
微博用户签到数据
序号字段名标识符
1用户IDuserID
2地点location
3性别gender
4年龄age
5经度x
6纬度y
7日期date
8时间time
9签到时间checkinTime
10签到点IDpoiid

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-2-22 19:16

来自 2#
Fuller 管理员 发表于 2020-2-22 19:16:50 | 只看该作者
已经上线了4个微博签到数据的快捷采集,不用做规则,直接使用:
1,微博签到采集_主页
2,微博签到采集_探索此地
3,微博签到采集_此地热议
4,微博签到采集_来过此地的人

用这些工具把微博数据采集下来以后,可以把里面的地址信息找出来,然后再在百度地图api上翻译成经纬度。

找的过程中,可以手工找,手工去查百度得到经纬度。如果数量很大,那就要写一个程序翻译经纬度,或者委托我们做处理
举报 使用道具
板凳
Fuller 管理员 发表于 2019-11-26 22:15:43 | 只看该作者
最近采集微博签到信息的很多,难道有什么研究课题?
最容易实现的采集方案是:
1,先选定好签到景点,进入这个景点的网页,翻页采集所有签到人的网址
2,把所有博主的网址导入采集博主信息的工具(https://www.gooseeker.com/res/softdetail_8.html ),采集他的基本资料。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-4 04:25