资源 | 数据工程师的衣柜,资源之家

百家 作者:大数据文摘 2018-08-08 18:00:02

大数据文摘出品

编译:CoolBoy


今天,文摘菌要给大家介绍一个数据工程(注:非数据分析)资源超级大列表,你想找的全部在这儿~(Github链接见文末)


这个资料集是由区块链公司POA Network的技术负责人Igor Barinov所制作的。资源本身并没有代码之类的内容,而是为大家总结了数据工程上必要工具的链接,包含了从数据库到并行处理,再到数据集等一系列内容。每一项分类下都有清楚的链接和简介。


这个资源集的目录如下:


着实是很全面的一个列表,从事数据工程的同学应该很熟悉。


这个列表的内容有多详细呢?我们可以看一下关系数据库(relational database)的例子来窥斑见豹:



可以看到,仅仅是关系数据库这一项,作者就总结出了一份很齐全的工具列表,包括了MySQL、PostgreSQL等大家熟悉的工具,也有其它稍微陌生一点的名字。而MySQL下面也附着了基于MySQL协议的相关工具。


在整个数据库(Databases)的大板块下,其他的数据库模型(Key-Value、Column、Document、Graph、Distributed、Timeseries、Others)也被如此详细地总结出来。其他的大板块亦是如此。


此外,列表的最后还有一个社区的板块,包含了论坛、会议和Podcast的链接:



有没有厉害的同学要给这个列表进行补充呢?


Github链接:

https://github.com/igorbarinov/awesome-data-engineering


【今日机器学习概念】

Have a Great Definition

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接