酷应用

机器学习和洗衣机的关系？

百家作者：AI100 2018-06-27 13:03:16

HAL 9000（来源：ScieNews.com）

译者 | 婉清

编辑 | 阿司匹林

出品 | AI科技大本营（公众号ID：rgznai100）

【AI科技大本营导读】机器学习是目前计算机领域最火的技术之一，从电商到自动驾驶，都有机器学习的应用。但是，当大众谈起机器学习时，却往往以 AI（人工智能）代称，这遭到了很多学者的批判，机器学习宗师级大牛迈克尔 · 乔丹更是直言不讳，称“我讨厌将机器学习称为 AI”。

虽然机器学习目前能够解决的问题非常有限，但是它确实让我们看到了新一轮科技变革的曙光。然而，关于机器学习的炒作已经太多，我们需要从不同的角度去审视它，认真思考，才能真正理解它。

作为一名风投经理，Andreessen Horowitz 展现了自己的独特视角，提出关系数据库和自动化是帮助我们理解机器学习的两个重要概念。Horowitz 认为，洗衣机是自动化机器的一种，但是它没有“智能”，而机器学习也可以看作一种可以实现自动化的技术，人们用它打造的只不过是一台台智能时代的“洗衣机”。

以下内容由AI科技大本营编译：

机器学习进入公众视野已经有四五年了，几乎达到了妇孺皆知的地步。不仅每天都有各种初创公司涌现，大型科技平台公司也正围绕机器学习进行自我改造：科技行业以外的所有人大都读过《经济学人》或《商业周刊》的封面故事，很多大公司也有一些项目正在进行。我们都知道，这会是下一个风口。

更进一步，理论上我们大多了解神经网络是什么，它可能与模式和数据有关。机器学习让我们在数据中找到模式或结构，这些模式或结构是隐式和概率性的（因此是“推断”），而不是显式的，这在以前只有人类才能找到，计算机是无法找到的。机器学习解决了这类问题：那些以前“对计算机而言很难，但对人类来说很容易”的问题，或者说“对计算机来说很难描述”的问题。

不过，我认为我们还没有一个明确的概念，即机器学习对科技公司或更广泛的经济体系中的公司意味着什么，如何在结构上思考它能够带来什么新事物，或者机器学习对我们所有人意味着什么，以及它实际上能够解决什么重要问题。

“人工智能”（Artificial Intelligence）一词并没有起到什么帮助作用，它只会让讨论进行不下去，或者早早结束。当我们说起“人工智能”时，就好像 2001 年初的黑色巨石（black monolith）出现了一样，我们都变成了猿类，对着它尖叫，挥舞着拳头。结果就是，我们无法真正分析“人工智能”。

编者注： black monolith，黑色巨石。源自阿瑟·克拉克（Arthur C. Clarke）的科幻小说《2001：太空奥德赛》（Space Odyssey，又译:《2001：太空漫游》）。书中描述道，高度智慧的外星生命在地球上留下了一块黑石。在书中黑石代表着远远超过人类触及范围的智慧。

事实上，我可以列举一长串无助于讨论当前机器学习发展的方式，例如：

数据是新的“石油”

Google 和中国（或 Facebook、Amazon，BAT）拥有所有的数据

人工智能将承担所有的工作

把机器学习称为人工智能

当然，也有其他更有益的方式：

自动化

技术赋能层

关系数据库

为什么提到关系数据库？因为它是一个新的基础赋能层，改变了计算机所能胜任的事情。在于上世纪 70 年代末关系数据库出现之前，如果你想让数据库显示你希望的东西，比如“所有已购买此产品且居住在此城市的客户”，通常需要一个专门的工程项目才能实现。数据库不是用结构化的，因此任何任意交叉引用查询都非比寻常的困难。数据库是记录保存系统，而关系数据库则把它们变成了商业智能系统。

这样一来就极大地改变了数据库的用途，从而创建了新的用例，催生了市值高达数十亿美元的新公司。关系数据库不仅为我们带来了 Oracle，也带来了 SAP。而 SAP 和它的同行们给我们带来了全球即时供应链——苹果和星巴克。到了 90 年代，几乎所有的企业软件无一例外都是关系数据库：PeopleSoft、CRM 和 SuccessFactors 等数十种软件都是运行在关系数据库之上。没有人指着 SuccessFactors 或 Salesforce 说，“这玩意儿将永远不会起作用，因为 Oracle 拥有所有的数据库”——相反，这项技术成了一个赋能层，它成了所有东西的一部分。

所以，这也是如今我们思考机器学习的一个很好的方式——它是我们利用计算机所能做的进一步改进，它将成为许多各家公司不同产品的一部分。最终，几乎所有的东西都有机器学习在里面，没人关心，也没人惊奇。

两者之间重要的相似之处在于，尽管关系数据库具有规模效应，但别忘了网络是有限的，或者说“赢家通吃”的效应，机器学习也一样。如果 B 公司和 A 公司一样，从同一家供应商购买相同的数据库软件，那么 A 公司使用的数据库并不会因此变得更好。机器学习实际上也是差不多的情况：机器学习都是数据相关的，但是特定应用的需要的数据却是不同的。更多的手写数据会使手写体识别器变得更好，而更多的燃气轮机数据也会使系统更好地预测燃气轮机的故障，但是其中一套数据对另一个系统却毫无帮助。记住，数据是不可替代的。

这就触及了在谈论机器学习时最常见的误解的核心：在某种程度上，机器学习是通往 HAL 9000 （编者注： HAL 9000是《2001：太空漫游》中的最具人性的超级计算机）道路上一种单一的、通用的东西；或者 Google 或微软各自建立了“一个（HAL 9000）”；或者 Google “拥有所有的数据”；或者 IBM 已经拥有了一个真实的东西（HAL 9000），叫作 Waston。的确，人们在看待自动化时总会犯相同的错误：每一波自动化浪潮，我们夺回想象人们正在创造一些拟人化的东西，或者具有通用智能的玩意。要知道，这可是有前车之鉴的：在 1920-1930 年代，我们想象的是，钢铁机器人拿着锤子在工厂里走来走去；而在 50 年代，我们想象的是人形机器人在厨房里干家务。然而我们并没有得到机器仆人，但好在我们有了洗衣机。

你可以说洗衣机就是机器人，但它们没有“智能”。它们并不知道水和衣服是什么。此外，就算在洗涤领域中，洗衣机也并不是通用的：你不能把盘子放进洗衣机里，也不能把衣服放进洗碗机里（或者说，你可以这么做，但你不会得到想要的结果）。它们只是另一种形式的自动化罢了，在概念上，与传送带或送料机并没有什么不同。同样，机器学习让我们得以解决以前计算机无法解决的问题，但是这些问题中，每个问题都需要不同的实现、不同的数据、不同的市场路线以及不同的公司才能解决。这些都是自动化的一部分，你可以把它们看作一台台洗衣机。

因此，我们谈论机器学习的挑战之一，就是在数学的机械解释与幻想之间找到一个平衡点。机器学习并不会创造出 HAL 9000（至少，这个领域中很少有人会认为它很快就能实现），但认为它“只是统计数据”对于理解也没有帮助。让我们重新审视与关系数据库的相似之处，这可能更像是在 1980 年讨论 SQL 一样：如何从解释表连接（table join）到思考 Salesforce.com？如果你说“这可以让你问些新问题”，这当然是非常好的，但是问题并不总是清晰明了。你可以制作一些令人印象深刻的语音识别和图像识别的演示，但是，如果是一家普通的公司会怎么做呢？就像美国一家大型媒体公司的一个团队不久前对我说的那样：“我们知道，我们可以使用机器学习来索引十年来的运动员采访视频，但是，我们寻找的究竟是什么呢？”

那么，对于真正的公司来说，机器学习的“洗衣机”到底是什么呢？我认为有两套工具可以用来帮助思考这个问题。首先是考虑数据类型和问题类型的流程：

那么，对于真正的公司来说，机器学习的“洗衣机”到底是什么呢？我认为有两套工具可以用来帮助思考这个问题。首先是考虑数据类型和问题类型的形式：

对于拥有相关数据的问题，机器学习可以提供更好的结果，这仅仅是作为一种分析或优化技术。
机器学习可以让你基于已有数据提出新的问题。
第三，机器学习为分析领域开辟了新的数据类型：以前计算机无法真正“读取”音频、图像和视频，而现在这种可能性越来越大了。

在这方面中，我发现最令人兴奋的是影像领域。以往，只要我们有计算机，就能够处理文本和数字，但图像（和视频）对它们而言，大多都是盲区。现在，它们可以“看到”了，就像它们可以读文本和数字一样。这意味着图像传感器（和麦克风）将成为一个全新的输入机制：与其说是一个“摄像头”，还不如说就是一个全新的、强大的、灵活的传感器，它可以生成机器可读的数据流。未来各种各样的问题，最终都会演变成计算机视觉问题，尽管今天看上去并不像是计算机视觉方面的问题。

最近我遇到了一家为汽车行业提供座椅的公司，该公司已经在廉价的 DSP 芯片上部署了神经网络，并与廉价的智能手机图像传感器相结合，以检测织物是否有起皱的现象（我们应该期待的是，市面将涌现各种类似用途的机器学习的小玩意儿，它们非常小巧、便宜，只做一件事，就像文章 Why the Future of Machine Learning is Tiny 说的那样）。它实际上就是把以前无法自动化的任务自动化，因此将它描述为“人工智能”是不利于我们理解的。

这种自动化的概念是思考机器学习的第二个工具。发现织物上是否存在起皱的现象并不需要 20 年的经验：做到这一点，真的只需要哺乳动物的大脑就够了。事实上，有位同事跟我说，你可以训练狗狗做的事情，机器学习也可以做到，这也是思考人工智能偏见的一个有用途径（狗狗到底学到了什么？训练数据中有什么？你确定吗？你会怎么问？），但是它也有限制，因为狗狗确实具备一般的智力和常识，并不像我们知道的任何神经网络。吴恩达表示机器学习在不到一秒内就可以做任何你所能做的事情。谈论机器学习确实是在寻找隐喻，但我更喜欢这个隐喻：机器学习给你的其实是无限数量的实习生，或者无限数量的十岁孩童。

五年前，如果你给一台计算机一堆照片，它所能做的，只是按照片尺寸大小排序。而一个十岁孩童，可以把这堆照片按男人和女人来分组，一个十五岁的少年可以按照“酷”和“不酷”来进行划分照片，一个实习生可以指着某张照片说“这个人真的很有趣”。今天，有了机器学习的加持，计算机的能力将会与十岁孩童或者十五岁少年相仿。但它可能永远不会达到实习生的水平。但是如果你有一百万名十五岁的少年来一起来查看数据，你将会怎么做呢？你会接听什么样的电话，会浏览什么样的图像，会检查哪些文件传输或用信用卡付款呢？

也就是说，机器学习不必与专家或者数十年的经验或判断相匹配。我们不是自动化专家。相反，我们要求的是：接听所有的电话，找到那些愤怒的人；浏览十万张照片，找到那些看上去很酷（或者至少看上去怪异）的人。

从某种意义上说，这就是自动化始终在做的事情；正如 Excel 并没有给我们带来人工会计师，Photoshop 和 Indesign 也没有给我们带来人工平面设计师，实际上，蒸汽机也没有给我们带来人造马匹。（在早期的“人工智能”浪潮中，能够对弈国际象棋的计算机并没有给我们带来一个装在盒子里的、性情乖戾的俄国中年人。）相反，我们将一项离散任务大规模地自动化了。

如果这个隐喻被打破（就像所有的隐喻一样），那么，在某些领域中，机器学习不仅能找到我们已经能够识别的东西，而且还能找到人类无法识别的东西。DeepMind 的 AlphaGo 就是最好的例子。AlphaGo 不会像下国际象棋的计算机那样去下围棋：按照顺序分析每一种可能的棋步。相反，它被赋予了规则，让它自己尝试制定策略，与自己下棋的次数，要比人类在有生之年所能下的棋还要多。也就是说，这并不是一千名实习生，而是一名非常非常快的实习生。如果你给实习生一千万张照片，他们浏览完会说：“这很有趣，但当我看到第三百万张照片时，这种模式才真正开始出现。”那么，哪些领域足够窄又足够深，以至于我们可以告诉一个机器学习系统规则（或者给它一个分数），只要查看所有数据，就能得出人类无法得出的新结果？

我花了很多时间去了解大公司，讨论他们的技术需求，他们在机器学习方面通常有一些非常明显的、可轻易实现的目标。既有很多明显的分析和优化问题，也有很多明显的图像识别问题或音频分析问题。同样，我们讨论自动驾驶汽车和混合现实的唯一原因就是机器学习（可能）让它们能够得以实现。但当我们讨论织物上的起皱情况或客户服务中心的情绪分析之后，这些公司接下来往往问道：“还有什么呢？”这将带来什么其他的东西吗？它会发现哪些我们不知道的未知事物呢？

在机器学习变得稀松平常之前，我们可能还有十到十五年的时间。