Jeff Dean:谷歌大脑背后的“大脑” | AI名人堂

百家 作者:AI100 2018-07-05 07:44:50

栏目简介:激荡六十年,人工智能已经起航。然而在未来面前,我们都还是孩子。究竟是“奇点临近”?还是泡沫行将破灭?为了解惑,《AI名人堂》将汇聚领航者智慧,和你一起探索前行的方向。


作者 | 杨丽

出品 | AI科技大本营


6 月 28 日上午 9 时许,清华大学的李兆基科技大楼内,Google 人工智能部门负责人 Dean 带领着他的团队集体现身。队伍中不乏有 Google AI 的标志性人物李飞飞、李佳、Quoc Le、Bill Freeman 等人。


在接下来的两天时间里,一场人工智能领域的顶级学术思想碰撞就此展开。


而这距离谷歌 AI 中国中心成立还不到 7 个月,距离谷歌的另一大高层变动——Jeff Dean 成为 Google AI 的真正负责人,更不足两个月。


那时,Google 人工智能和搜索业务负责人 John Giannandrea 卸任,该部门也重新拆分为单独的人工智能和搜索部门,前者由原谷歌大脑项目负责人 Jeff Dean 负责。


因此,在此次研讨会上,有人抛出问题:Jeff Dean 在接管了整个 Google AI 团队之后,是否已经有了「小目标」?


毕竟,Google 此前一直致力于将机器学习、人工智能整合到最核心的产品和服务中——搜索业务。


科技媒体 TheVerge 评论称,「此次重新拆分似乎意味着 Google 想要将 AI 技术注入到其更多的实际业务中。」


基于自身的互联网服务和 Android 平台的海量用户,在 2C 市场,Google 不仅可以直接将这部分用户转化潜在消费者,还能获取大量的行为数据,满足深度学习平台的训练需要,进一步优化 Google 的各类 AI 产品。


如此,将人工智能整合到更多 AI 应用中的接力棒,转交到了曾为 Google 做出过杰出贡献的 Jeff Dean 的手中。


「Google AI 未来的进展,将围绕两部分展开:一是 AI 的基础研究,二是整个计算相关的技术探索。」Jeff Dean 如是说。


Jeff Dean 何许人?他在 Google 内部是扮演着怎样的角色?Jeff Dean 将会带领着拆分后的 Google AI 走向何方?这都应该从头说起。



1999 年的首秀


或许你听过这样一段故事:「编译器不会向 Jeff Dean 给出警告的,Jeff Dean 会给编译器警告的……Jeff Dean 是直接写二进制代码的,然后他写了源代码,作为给其他开发人员看的文档……」


在许多膜拜他的程序员眼中,Jeff Dean 智而近「妖」。这又是为何?大概还需要从 1999 年说起。


1999 年的科技圈是另一番景象。


那时,雅虎还未被 Verizon 收购,作为一流的互联网公司,也是网络信息搜索的主要来源,尽管它当时并非是一个搜索引擎。微软倾尽其所有接管 Web 浏览器业务,推出了 MSN 网站,并宣扬它是目前的互联网巨头。Ask Jeeves 搜索引擎则被估值数十亿美元。而 Google 还是一家名不见经传的创业团队。然而,6 月获得 2500 万美元融资之后,Google 正式按下了「快进模式」。


这时,Google 也迎来了第 20 号员工 Jeff Dean。


资深科技新闻记者史蒂文·莱维(Steven Levy)在《In The Plex:How Google Thinks, Works and Shapes Our Lives》一书中曾这样描述:


当时,(美国数字设备公司的)一部分工程师已经发现了网站链接在搜索中的巨大作用。Jeff Dean 认为,如果一套系统能为用户指向与他们喜欢的相关页面,这对用户将非常有帮助。例如,读者在《纽约时报》上阅读一篇文章时,系统会弹出并询问是否另外 10 个与其阅读相关的页面。


Dean 此前从未对信息检索产生过兴趣。而现在,他预感一场颠覆正在发生。他的想法改变了。这段时间,他与 AltaVista 团队的合作并不光彩。「AltaVista 发展非常快,却聘请了一些我认为技术上不够好的人士」,Dean 提到。换句话说,他想离开这里。1999 年 2 月,Dean 离职转而进入一家名为 mySimon 的初创公司。


不过在这几个月里,Dean 却感到十分无聊。偶然的一次机会,他从自己的毕业生顾问那里得知了 Urs Hölzle(后来的 Google 基础机构高级副总裁)加入了一群正在研发 PageRank 算法的团队。「我觉得 Google 将变得更好,因为这里有许多我熟知的人,技术上也似乎十分精湛。」他解释道。原本,在 Google 的工作在 8 月正式展开,但 Jeff Dean 已经迫不及待兴奋起来了。就在前一个月 mySimon 的工作结束期间,他就已提前造访 Google 了。


在后来接受媒体采访时,Dean 回忆道:「当时 Google 成立还不到一年,所有的员工只能挤在加州帕罗奥多市中心的二楼办公室,楼上是一家 T-Mobile 商店。没办法,公司团队还不足 20 人,用于休闲娱乐的一台乒乓球桌也索性变成了员工们在上面吃午饭的桌子。」


这是 1999 年的那个夏天。


搜索的成功


或许,这既在意料之外,却又在情理之中。也就是在五年后的夏天,Google 进行了首次公开募股。


这一年,雅虎收购了来自中国的 3721,并成功将其创始人周鸿祎纳入麾下。一时间,雅虎搜索风光无限。不过,巅峰之后的雅虎很难再做出创新了。直到 2016 年,威瑞森电信宣布以 48.3 亿美元收购其核心业务,标志着这家世界门户网站鼻祖彻底走下神坛。 


据了解,在写给华尔街的信中,Google 创始人 Larry Page 和 Sergey Brin 曾给出了以下陈述:「搜索并处理世界上的所有信息,这是一项特别重要的任务,这项重任应由值得信任并对公众利益感兴趣的公司承担。」


而奠定了搜索这一基础的关键人物之一便是 Jeff Dean。


对于他来说,加入 Google 做的第一件棘手的事,是要将广告系统(即后来的 AdSense)的初始骨架整合在一起。


之后的四五年时间里,Jeff 与团队合作开发了 Google 核心搜索系统,将所有可以搜集到的业务整合到一个索引中,然后将其变为一个用户提问可迅速做出回应的系统。


不过,就在 Google 急速发展的过程中也遭遇了一项巨大的技术挑战。据 Dean 回忆,「我们不能足够快地部署更多的机器来响应需求」。


这时,Jeff Dean 遇到了另外一位与之并誉为「谷歌双雄」的 Sanjay Ghemawat。合作期间,他们共同设计和实现了大名鼎鼎的 MapReduce,以及后来的分布式数据库系统 Bigtable。设计之初,MapReduce 主要是为开发者解决其搜索引擎中大规模网页数据的并行化处理。


2004 年,当 Google 在国际会议上发表了有关该项技术的研究论文后,MapReduce 立即成为了大数据处理的工业标准。自此之后,MapReduce 作为一个针对大规模数据处理的分布式编程模型,为其他各类项目奠定了重要基石。例如,最早实现 MapReduce 的 Nutch 项目,后来演变为了众所周知的开源框架 Hadoop。


随后,Dean 与团队又相继开发了数据库系统 Bigtable 和 Spanner,并构建搜索索引或处理卫星图像等事情的软件基础设施。2009 年,Dean 当选美国工程院院士。


谷歌大脑的雏形


《纽约时报》的一篇长文「The Great A.I. Awakening」中曾这样写道:


Jeff Dean, though his title is senior fellow, is the de facto head of Google Brain. Dean is a sinewy, energy-efficient man with a long, narrow face, deep-set eyes and an earnest, soapbox-derby sort of enthusiasm. 


译:尽管 Jeff Dean 对外的头衔是高级研究员,但他确实是谷歌大脑的实际带头人。他身材健瘦,修长的脸上眼窝深陷,透露着一股热忱。


2011 年的一天,Dean 走进了山景大厦大楼一个名为「MicroKitchen」的休息室里,在这里,他碰见了日后对谷歌大脑、对自己影响颇深的吴恩达。年轻的吴恩达还是斯坦福大学计算机科学教授,同时也是 Google 的顾问。


当时,吴恩达告诉了 Dean 关于「Project Marvin」的事情:「最近正帮助建立『神经网络』的实验……而 Google X(秘密实验室)正在做的『Project Marvin 』已经取得了一些惊人成果。」


实际上,Dean 自己早在 1990 年明尼苏达大学上学时就做过简单版本的神经网络。如今,五年过去了,研究深度网络的学术人员,也从屈指可数的几位增长到了几十位。


有了对这个项目的兴趣,Dean 开始和吴恩达兼职合作参与到 Google X 的项目,并对深度神经网络进行了深入调研。很快,Dean 建议吴恩达邀请有神经科学背景的同事 Greg Corrado 加入。后来,吴恩达最优秀的一个研究生 Quoc Le 也作为项目的第一个实习生加入了团队。由此,「谷歌大脑」的雏形开始形成。


而此时的硅谷正呈现出一股人工智能的热潮,凉了近 20 载的人工智能第三次浪潮悄然而至,电脑芯片的计算能力高速增长、全球互联网发展带来的数据指数级爆炸。


随后,Google X 联合斯坦福大学顺势推出了聚焦深度学习的项目「谷歌大脑」。


2012 年,Jeff Dean、吴恩达、Greg Corrado 三人合作进行了一场空前轰动的试验:将 1.6 万个处理器相连接创建出了全球最大的中枢网络系统,自主学习 1000 万张图片后,在 YouTube 视频中成功认出了猫的图像。Dean 当时激动地说:「在训练中我们从没说过这是一只猫,从本质上,它发明了『猫』这个概念。」


在此期间,Google 的第一代大型深度学习软件系统 DistBelief 也建立了起来。


为了简化和重构 DistBelief 的代码库,使其变成一个更快、更健壮的应用级别代码库,包括 Dean 在内的多位技术专家合力完成了对 TensorFlow 的研发,这也是谷歌大脑深度学习的第二代标志性软件。


2015 年 11 月,TensorFlow 正式开源。这款深度学习框架在 Google 内部也从最开始的几个团队到后来 200 多个团队上千人投入生产和使用,囊括搜索、广告、相册、地图、翻译和 YouTube 等。


Google 的焦虑


有人说,大公司往往会因循守旧而错过孕育着未来的机遇。


十年前,Google 联合多家硬件制造商、软件开发商及电信运营商成立联盟共同研发 Android,并发布了基于 Linux 的手机操作系统 Android。


2010 年末的一项数据显示,从市场占有率上看,Android 一跃成为全球最大的智能手机操作系统。此后的数年时间里,Google 不仅一直保持着在搜索引擎领域的霸主,还凭借 Android 成功把握上移动的风口。


直到 2017 年,Google 宣布在手机搜索应用上线一项新的功能「Google Feed」,即通过算法向用户推荐个性化的资讯内容。尽管 Google 强调他们并非有意抄袭,但还是不免让人想起了 Facebook 的推荐引擎 News Feed,想到了两大巨头日益增长的竞争关系。


一个鲜明的趋势是,二者在核心业务上的差异正逐渐缩小。2016 年,在美国总统大选期间,Facebook 成功击败 Google 成为最大的数字广告投放平台。2017 年的一项数据显示,Feed 流广告为 Facebook 每天产生了近 4000 万美元的收入。


原来,此前巨头们的商业模式主要依靠以搜索引擎为代表的流量分发,开始转变为以内容分发为主的 Feed 流模式。


Facebook 正不断蚕食掉 Google 的未来。


或许也正是因为如此,Google 终于意识到变革的重要性。2017 年 10 月,新上任的 CEO 桑达尔·皮查伊(Sundar Pichai)正式宣布 Google 从 Mobile First 转向 AI First 的战略。自此,Google 正式开始从一家以搜索引擎推动主营业务的公司向 AI 全力转型。


庞大的数据群、算法、以及高性能计算机集群带来的强大算力,Google 几乎样样具备,而搜索引擎或许也可以看做是 Google 人工智能的早期雏形。转型 AI 对 Google 而言顺理成章,那么由谁在前方负责高瞻远瞩呢?


背后的“大脑”


今年 1 月,Dean 晒出了谷歌大脑 2017 的第一份成绩单:从 AutoML、语义理解和语言生成、到机器学习算法、TPU、TensorFlow 和开源软件等基础研究工作都取得了傲人的成绩。当时,Dean 还提到接下来会撰写第二篇文章,重点探讨机器学习在重点领域的深入研究,如医疗、机器人和一些基础科学领域等。


显然,这份漂亮的成绩单离不开 Jeff Dean 这位谷歌大脑背后的「大脑」的推动。


2012 年,在 Dean 的主导下,Google 收编了创业公司 DNNresearch 以及「神经网络之父」Geoffrey Hinton 团队,正式将 Google 带到了深度学习的路上。


2016 年,在韩国分享的《智能计算系统中的大规模深度学习》中,Dean 详细阐述了 Google 深度学习在语音、视觉、语言和语义等方面的具体应用。


带领谷歌大脑团队时,Dean 一般会花些时间查看邮件、看文件、写意见,有时也会写写技术文档,跟团队或整个 Google 的同事开一对一的小会,思考关于整个团队的技术或组织问题。


除了基础科学的研究之外,谷歌大脑还会与其他做应用、工程、开发等各类团队进行合作。例如,在去年,谷歌大脑通过与李飞飞博士带领的团队密切合作,推出了 Cloud AutoML 系列产品中的第一个——AutoML Vision。据了解,即使是没有机器学习专业知识的小白,也能快速借助这项服务搭建定制化的图像识别模型。


其实,按照 Dean 的话来讲,「自己并非机器学习领域的专家,更擅长的是在计算机系统领域。」对于他而言,在 Google 服务了近 18 年之后,磨砺的不仅是自身出色的技术储备,还有作为一名决策者在企业管理、业务运营及制定决策方面的能力。


在去年接受媒体 Gigaom 提问时,Dean 曾表示:「我们在进行大量的机器学习和 AI 方面的研究,然后利用研究成果来制造智能系统。如果一个智能系统在一种产品中使用,那么通常情况下可能会带动新产品的产生。」顺着这条线,我们不难发现:Dean 早已为 Google AI 的商业化有所预想。


不过,由于近期 Google 深陷「涉足美方军事领域」的问题,不少媒体观察者认为:为称霸云业务,并实现让自己成为一家「AI First 公司」的梦想,Google 将发现它很难避免战争业务。


但尽管如此,Dean 还是同 Google 的绝大多数员工一样,态度十分强硬。他在今年的 Google I/O 开发者大会上披露称,早在 2015 年,他就签署了一封旨在反对利用人工智能开发自动武器的公开信。向军方提供人工智能功能的 Gmail 完全没问题,但在其他情况下,问题就变得更加复杂。「很明显,作为一家公司,我们希望我们的决策保持连贯性。」他说。


人工智能带来的巨大机遇,正通过 Google 开放的技术资源和产品工具,让越来越多的开发者将 AI 应用到自己的产品中,进一步普世 AI。


这或许也解释了此次 Google AI 与清华大学达成合作,Jeff Dean 担任其人工智能研究院顾问,成为连接 Google 与中国在人工智能领域合作的关键一员。继去年 Google AI中心落地中国之后,Google 相继宣布将在法国巴黎、甚至非洲大陆上设立 AI 研究中心,继续扩张人工智能版图。面对全球这个庞大而又竞争日渐激烈的市场,Google 再也无法错过。


——【完】——


在线公开课NLP专场

精彩继续


时间:7月12日 20:00-21:00

扫描海报二维码,免费报名

添加微信csdnai,备注:公开课,加入课程交流群


点击 | 阅读原文 | 免费报名

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接