• 标题:【GDELT项目大型数据集下载】#集搜客GooSeeker数据集开放目录#
  • 分类:科研学术
  • 关键词:新闻、社会事件、社会学、社会安全
  • 摘要:GDELT projectGoogle Jigsaw 支持的项目,GDELT项目监视全世界100多中语言的广播、印刷媒体和web信息,几乎覆盖全球任何角落。这是一个开放的计算平台,能计算识别出驱动全球社会活动的各方面要素。
  • 链接:http://gdeltproject.org/data.html

更多信息:
the GDELT Project monitors the world's broadcast, print, and web news from nearly every corner of every country in over 100 languages and identifies the people, locations, organizations, counts, themes, sources, emotions, counts, quotes, images and events driving our global society every second of every day, creating a free open platform for computing on the entire world.

这是一个极具价值的数据集,可用于文本挖掘、时间序列分析和预测模型建立,可能的应用范围举例:经济预测、股市黑天鹅事件捕捉、总统大选预测等。
可申请下载的数据集包含从1979年1月1日到2013年3月31日的所有事件,而且信息维度及其丰富。因为数据量太大,需要分时间段下载,1979年到2005年按照年度下载,从2006年1月开始月度下载。
                  




举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2016-11-23 09:54

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 爬网址做层级采集——以当当商品爬虫为例
  • 网络爬虫采集列表数据
  • UMAP的min_dist参数有什么作用?
  • UMAP的n_neighbors参数有什么作用?
  • HDBSCAN的min_samples和min_cluster_size参

热门用户

GMT+8, 2026-6-22 15:26