强烈推荐:如何找到免费大数据,获取相关数据
如今的我们,淹没在大数据的海洋中,却又忍受着因没有数据而导致的饥渴。很多人都想做大数据研究,但数据在哪里呢?数据不再是“资源”,而是变成了一种重要“资产”。
—— 摘自《数据科学理论与实践》
除了利用网络爬虫收集数据、数据生成和存储部门的供给之外,我们还可以通过以下方式获得大数据(在每一类途径之下给出了代表性数据集):
1政府开放数据
美国政府开放的数据集 :https://www.data.gov/
美国交通事故数据集:https://www-fars.nhtsa.dot.gov/Main/index.aspx
美国空气质量数据集:http://aqsdr1.epa.gov/aqsweb/aqstmp/airdata/download_files.html
印度政府公开的数据:data.gov.in(https://data.gov.in/)
英国政府公开的数据集:https://data.gov.uk/
2企业或公益组织
Amazon Web Services (AWS) datasets:(https://aws.amazon.com/datasets/
Google datasets:https://cloud.google.com/bigquery/public-data/
Youtube labeled Video Dataset:https://research.google.com/youtube8m/
NASA:https://data.nasa.gov/
世界银行:http://www.shihang.org/
纽约出租车:http://chriswhong.github.io/nyctaxi/
3大数据竞赛平台
Kaggle:https://www.kaggle.com/datasets
Past KDD Cups:http://www.kdd.org/kdd-cup
Driven Data:https://www.drivendata.org/
4机器学习领域经典数据集
UCI:https://archive.ics.uci.edu/ml/datasets.html
Delve Datasets: http://www.cs.toronto.edu/~delve/data/datasets.html
5统计学领域经典数据集
统计学领域论文、学术期刊、著名图书中的数据集
各类统计年鉴
统计数据库
6其他
R包中的数据集,如nycflights13
本文授权转自:数据科学DataScience;
END
如果你对人工智能与机器学习感兴趣,请加交流群:群号:139482724 ;
版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。
关联阅读:
原创系列文章:
数据运营 关联文章阅读:
数据分析、数据产品 关联文章阅读:
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 确保“十五五”开好局起好步 7903927
- 2 员工“踢了一脚” 救了老板一命 7808343
- 3 故宫下雪了 7711838
- 4 2026年经济工作要这么干 7616905
- 5 村支书卖小米被小米法务投诉下架 7520528
- 6 女子买千元羽绒服穿1天变吸油服 7425440
- 7 直击北京初雪 7328393
- 8 凭煮蛋涨粉350万 “蛋神”回应爆红 7238714
- 9 茅台价格跌破1499元 7136239
- 10 中央经济工作会议释放哪些重要信号 7041697







数据分析
