解决现实世界问题的四大机器学习策略
解决现实世界问题的四大机器学习策略
原文: Four machine learning strategies for solvingreal-world problems
来: https://blogs.sas.com/content/subconsciousmusings/2018/10/17/four-machine-learning-strategies-for-solving-real-world-problems/
导读:
有的在线学习算法还会“适应”,即随时调整模型,跟随或追踪数据的变化。具体而言,它们会逐渐“遗忘”过时数据,从而适用于环境/模型随时变动的应用程序。
原文翻译:
机器学习有四种广受认可的形式:监督式、无监督式、半监督式和强化式。在研究文献中,这些形式得到了深入的探讨。它们也被纳入了大多数机器学习算法的入门课程。下表对这四种形式作了总结。
Style of Learning | Definition | Characteristic | Examples |
Supervised | Supervised learning algorithms make predictions based on a set of examples. | Data has known labels. | Insurance underwriting and fraud |
Unsupervised | With unsupervised learning, there is a focus on finding patterns and gaining insight from data. | Labels or output are unknown. | Customer clustering and market basket analysis |
Semi-supervised | With semi-supervised learning, you use unlabeled examples with a small amount of labeled data to improve the learning accuracy. | Labels or output are known for a subset of data. | Medical predictions where tests and expert diagnoses are expensive and only part of the population receives them. |
Reinforcement | Reinforcement learning analyzes and optimizes the behavior of an agent based on the feedback from the environment. | Focus on making decisions based on previous experience. | Robotics, gaming, navigation, complex decision problems and reward systems. |
但一个并不广为人知的概念是机器学习策略,即以创造性的方式,运用基本的机器学习算法,解决现实世界问题。我对这些策略产生了浓厚的兴趣。在这篇文章中,我将探讨四种策略:在线学习、迁移学习、集成学习和深度学习。好在,这四项策略适用于表格中任意一种机器学习形式。
一、在线学习
在线学习使用瞬息万变的数据。这类模型跟着数据及时更新,并不存储先前的数据。有的在线学习算法还会“适应”,即随时调整模型,跟随或追踪数据的变化。具体而言,它们会逐渐“遗忘”过时数据,从而适用于环境/模型随时变动的应用程序。批量(或离线)学习使用静态的数据,可以充当在线学习的热身。在批量学习中,模型一次性完成所有数据的学习。很多在线学习算法使用一个批量/离线算法(以一小批数据为基础),为模型作启动前的热身。这种做法可以显著加快算法的收敛(convergence)速度。
二、迁移学习
迁移学习将一个领域的知识应用到另一个领域。它将旧的数据、模型和参数用于新问题的解决,对于机器学习模型的终身学习而言至关重要。迁移学习是人与生俱来的能力。举个例子,我们会将已经掌握的语言知识(词汇、语法等),应用到新语言的学习中。两种语言越是接近,知识迁移就越简单。
三、集成学习
单学习器模型只用一个学习器(算法),而集成学习使用多个学习器。一般的集成算法包含梯度提升、引导聚集、决策森林、堆栈集成和超级学习器。集成学习可以结合相对较弱(很多情况下,预测精度只略高于随机猜测)的学习器,产生强大、准确的模型。
四、深度学习
深度学习包含多个层,可以学习数据的层级化或多尺度特征。与之相对的是“浅层学习”,即简单地运用普通的机器学习建模算法。通常,浅层学习离不开特征工程(feature engineering),以保障输入以适当的形式呈现给模型,而深度学习在训练时,就自然而然地学会了这些特征。
在用机器学习算法解决日常业务难题时,机器学习策略是我们要考虑的又一个方面。
「完」
本次转自:品觉 微信公众号(pinjueche.com)
车品觉简介
畅销书《决战大数据》作者;国信优易数据研究院院长;红杉资本中国基金专家合伙人;浙江大学管理学院客席教授;全国信标委员;数据标准工作组副组长;美丽心灵基金会桑珠利民基金副主席。
原阿里巴巴集团副总裁,首任阿里数据委员会会长;现担任中国信息协会大数据分会副会长、中国计算机学会大数据专家委员会副主任、粤港信息化专家委员、中国计算数学学会第九届理事、清华大学教育指导委员(大数据项目)、浙江大学管理学院客席教授等职。
版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。
关联阅读
原创系列文章:
数据运营 关联文章阅读:
数据分析、数据产品 关联文章阅读:
80%的运营注定了打杂?因为你没有搭建出一套有效的用户运营体系
合作请加qq:365242293
更多相关知识请回复:“ 月光宝盒 ”;
数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
- 1 助力全国统一大市场建设 7904334
- 2 84斤女子吐槽买百件衣服基本穿不上 7807969
- 3 伊朗一港口发生高强度爆炸 7713649
- 4 五一大量外国人涌入中国 7617995
- 5 中使馆回应“特朗普称中国须让步” 7523526
- 6 陈妍希:假的就是假的它真不了 7425696
- 7 女子网购避孕套被骑手骚扰 7327623
- 8 印度男子婚礼当天新娘被调包成岳母 7232743
- 9 多地宣布发钱奖励结婚 7142795
- 10 家属称溺水“美人鱼”仍在ICU 7048292