资源 | Kaggle数据科学项目索引表,10大类93项,更新中

大数据文摘出品
作者:蒋宝尚
作为数据科学比赛平台,Kaggle丰富的算法、模型、项目等资源是巨大的宝藏。
为了使Kaggle上的资源获得最大化的利用,一位来自印度的数据科学家sban设计了一个数据科学模型、技术和工具的项目索引表。
在这里你可以查找到你所需要的数据科学资源,并超链接到项目页,附有代码展示。
整个数据科学表,一共提供了十个类别,每个类别里面都有分支,分支里的“词汇”在根据投票数量排列的同时,也在右侧说明了作者,项目实现所使用的编程语言以及阅读数,评论以及获得的投票数量。
另外,这个“索引表”还一直在更新,所以非常具有收藏的价值。

下面文摘菌简单带大家浏览一下这10个类别,想要具体了解的同学请点击:
https://www.kaggle.com/shivamb/data-science-glossary-on-kaggle/
1.回归算法
在本类别中,包括线性回归和逻辑回归两个部分,其中每个部分分别给出了10个示例。

2.正则化算法
此类别下,包含三个分支,分别是Ridge、Lasso、Elasticnet。其中Ridge分支下有10个示例,Lasso分支下有9个,Elasticnet有4个。

3.树形结构模型
此类别下的分支包含Decision Tree、Random Forest、Lightgbm Xgboost Catboost。每个分支下各有10个分支。

4.神经网络和深度学习模型
此类别下包含神经网络、自动编码、深度学习、卷积神经网络、胶囊神经网络等分支,每个分支所下都有所对应的词汇。

5.聚类算法
此类别包含Kmeans、层次聚类 、Dbscan密度聚类等。

6.Misc - Models
此类别包括朴素贝叶斯、支持向量机、临近算法、推荐引擎等的应用和相关示例。

7.重要的数据科学工具
此类别是一个超级类别,其下属包括处理、 维数约减、后建模技术以及模型融合这四个小类别,每个类别下包含若干分支。

8.文本数据
在这一目录下包含了自然语言、主题模型、词嵌入向量。

9.数据科学工具
Scikit、Tensorflow等众多框架和工具都包含在此类别下。

10.数据可视化
Seaborn、D3.Js、Bokeh等著名的数据可视化库和工具都能在此类别下找到。

最后文摘菌再次给出链接,大家请尽情享用吧!
https://www.kaggle.com/shivamb/data-science-glossary-on-kaggle/
【今日机器学习概念】
Have a Great Definition



关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 习近平同马克龙交流互动的经典瞬间 7904207
- 2 仅退款225个快递女子曾打造富婆人设 7808144
- 3 确认完最后一步 反诈民警蹲地上哭了 7714300
- 4 三项世界级成就见证中国实力 7619505
- 5 荷兰大臣:没想到中方叫停芯片出口 7521877
- 6 美国发生特大诈骗案 特朗普怒批 7425883
- 7 危险信号!俄数百辆保时捷突然被锁死 7332382
- 8 众擎T800人形机器人一脚踹倒自家CEO 7237247
- 9 15岁高中生捐赠南京大屠杀日军罪证 7140108
- 10 今日大雪 要做这些事 7042672







大数据文摘
