作为人类的 Scott-Morgan 已经死去,未来的 Scott-Morgan 将以赛博格电子人的身份继续活下去。
著名的英裔美国机器人科学家 Peter Scott-Morgan 博士几乎完全瘫痪了——除了他那双锐利的蓝灰色眼睛。那双眼睛一直在动,以控制屏幕上的鼠标打出文字,进而合成语音。不过,现年 63 岁的 Scott-Morgan 仍然毫不畏惧。「瘫痪是一个工程问题,」他坚持说。对此,他有一个解决办法:成为一个「半机械人(cyborg)」。Scott-Morgan 和丈夫 Francis 居住在英格兰西南部的海滨小镇 Torquay。2017 年,他被诊断出患有肌萎缩侧索硬化(ALS),也叫运动神经元病(MND)。折磨霍金的也是这种疾病。Scott-Morgan 和 Francis 的婚礼。自 2020 年英国黄金时段 Channel 4 纪录片「Peter: The Human Cyborg」及其后续回忆录「Peter 2.0」上映以来,Scott-Morgan 一直在英国享有盛誉。ALS 影响大脑和脊髓中告诉肌肉该做什么的运动神经元。随着病情的发展,大脑中运动神经元的退化会干扰传递给身体肌肉的信息,随后造成肌肉萎缩,使患者失去移动手臂、腿和身体的能力。最终,他们还会失去说话、行走、呼吸或吞咽的能力。多数患者会在症状首次出现后的三到五年内死于呼吸衰竭。2017 年,医生告诉 Scott-Morgan,他还有两年的生命。然而四年过去了,Scott-Morgan 依然坚强地活着,而且他也不想很快死去。英国 MND 协会的研究主任 Brian Dickie 博士熟悉 Scott-Morgan 的案例,他说,这位机器人专家拥有绝症界人士所说的「无可救药的乐观主义」。2021 年底,Scott-Morgan 接受了媒体专访,并且平静地等来了 2022 年的第一缕阳光。Scott-Morgan 不信上帝,他相信科技会拯救他。「我所有的早期科学教育都来自《神秘博士》和《星际迷航》,」他说,「他们教会我,如果你足够聪明、勇敢,并且能够接触到技术,一切皆有可能。」此时,Scott-Morgan 几乎已经完全被「锁定」了:除了眼睛和几块面部肌肉之外,身体的其他部位都无法动弹。他的嗅觉和味觉甚至都消失了,也不能自己呼吸,但他聪明的大脑依然完好。他现在依靠合成的定制声音与外界沟通,并通过面部扫描生成了一个 3D 动画形象。在公开演讲时,他会把这个动画形象展示在胸前的屏幕上。为了延长生命,他还接受了喉部全切除等一系列手术,并利用 OpenAI 的文本深度学习模型 GPT-2 等技术,突破了「人类」的局限。Scott-Morgan 和一个由技术专家、设计师、医生组成的全球团队一起完成了这些工作。他管他们叫「反叛者(The Rebels)」。此外,他的 Scott-Morgan 基金会还在与英特尔、CereProc、DXC 和联想等公司合作。这些公司可以提供人才、硬件、软件、人工智能等方面的支持。「反叛者」正在努力提高定制声音的表现力,开发自动驾驶轮椅,并在 Scott-Morgan 的家中嵌入智能技术。「在我丈夫 Francis 和无数善良而杰出的合作者的支持下,我发现曾经黑暗的未来现在无比光明,」Scott-Morgan 说。他的最终目标是通过一个用户界面控制他的合成语音、动画形象、单词预测器、自动驾驶轮椅和外骨骼。为此,他计划加大对 AI 的依赖。「半机械人(Cyborg)只是用来形容半人半机器状态的一个华丽辞藻,」他说,「与被困皮囊的痛苦、恐怖故事不同,大脑会继续前行。这听起来有点悲伤。如果你给它一个机会,大多数时候,它会忘记。日子一天天过去,我再也想不起来我能走路、能移动,甚至能说话。」Scott-Morgan 说,他最近参加了关于他的那部纪录片的活动,以对抗我们文化中围绕绝症的失败主义。他说,「从统计数据来看,社会只是希望像我这样的人蜷缩起来,在预定的时间死去。但我打算做一只人类小白鼠,看看我们能在多大程度上把科幻变成现实。」我第一次收到 Scott-Morgan 的消息是在 7 月份,他给我发了一封 111 页的电子邮件来介绍他的基金会,他只用了一个月的时间就完成了。「有时候,我一天只能设计两张幻灯片,」他写道。在其中一张幻灯片中,Scott-Morgan 描述了一个因为脚抽筋而无法交流的痛苦夜晚。不久之后,我发现自己的脚也抽筋了。起初,我以为我是受 Scott-Morgan 的心理影响在做噩梦,但几秒钟之后,我的脚还在持续抽筋。这让我想到 Scott-Morgan:如果我(这样活动自如的人)都控制不了脚抽筋的疼痛,他能怎么办呢第二天早上,我给 Scott-Morgan 发了一封电子邮件讲述我的经历,并表达了自己对他的担忧。他回应说,「客观地说,暂时失去使用高科技通讯系统的能力可能很痛苦,但更痛苦的是完全没有这个系统,那样的话你只能被锁在自己的活尸里,陷入无能为力的沉默和噩梦。」「幸运的是,我们有一个完善的高科技协议,」他补充道。他建议我和联想的首席技术官 Thorsten Stremlau 谈谈。联想正在提供实现 Scott-Morgan 愿景所需的智能硬件——智能摄像头、眼球追踪头戴设备和高性能计算基础设施。Thorsten Stremlau 说:「在一些罕见的时刻,你会看到技术真正的力量和潜力。在这些时刻,可能性似乎是无穷无尽且至关重要的。与 Scott-Morgan 博士会面就是这样的时刻之一。」Stremlau 是联想最早的项目团队成员之一,曾帮助霍金进行轮椅和笔记本电脑的 IT 设置。在这项工作的基础上,Stremlau 计划使用摄像头和可穿戴设备来检测 Scott-Morgan 的痛苦或生命体征异常。如果他因为没戴设备而无法交流,技术人员会提醒他的护理人员。Stremlau 说:「我们为 Scott-Morgan 解决的这些问题有助于推进我们的助残相关工作。」16 岁那年,在英格兰温布尔登长大的少年 Scott-Morgan 写了一篇关于未来如何将人脑与电子大脑联系起来的文章,并预判「我们融合在一起会比我们各部分简单相加更聪明」。1984 年,他出版了《The robotics revolution: The complete guide for managers and engineers》,这是一本关于未来机器人的书。在拿到计算机科学学士和人工智能硕士学位之后,他又在帝国理工学院获得机器人学博士学位,这是英国授予的首个此类学位。2017 年,Scott-Morgan 被诊断出患有 ALS。在被「冻住」之前,他意识到自己需要迅速采取行动来改造身体。他设想了三种手术:胃造口术、结肠造口术和膀胱造口术,分别将管子插入他的胃、结肠和膀胱。这项手术将使 Scott-Morgan 能够摄入更多营养,也免去了全职护工帮他上洗手间的需求。Scott-Morgan 将其称之为「三重造口术(triple-ostomy)」。挑战在于,没有任何患有 ALS 的人进行过这三项手术。下定决心之后,Scott-Morgan 和家属见了伦敦一家医院 ALS 方面的负责人,描述了他的计划。然而,正如 Scott-Morgan 在他的书中所记述的那样,在他解释完自己的推断之前,医生打断了他:「我拒绝参与其中的任何事情!」因此,Scott-Morgan 只得换了一名医生。新医生名叫 Tracy Thomas,她也无法理解 Scott-Morgan 的想法。「当我说到我将在我的疾病上投入大量尖端技术时,医生告诉我这将是一个新的冰冻地狱,这个地球上的任何外科医生都不会损伤完全健康的器官。」这一计划是相当激进的。更麻烦的是,大多数医生都不愿对 ALS 患者进行手术,因为全身麻醉会阻碍呼吸。此外,一些医生还担心,手术可能会导致患者的疾病发展得更快。最终,Tracy Thomas 被 Scott-Morgan 延长寿命的热情所吸引,并组织了与麻醉师 Maree Wright 博士的会面。「在第一次听说时,我好奇 Peter 为什么要进行这种高风险的手术,」Maree Wright 说,「世界上只有一个 Peter,他是一个开拓者。坦率地说,我们需要那些能打破常规的人来让我们思考和反思我们为什么以某种方式做事。」Scott-Morgan 对生活的渴望以及所表现出的热情和坦率让 Maree Wright 措手不及。这动摇了她对医学界如何治疗该疾病的看法。如果她能帮助他,这对其他 ALS 患者的影响可能是惊人的。但首先,她必须制定一个麻醉计划,且之前几乎没有任何关于如何麻醉 ALS 患者的研究数据。她最担心的是 Scott-Morgan 手术后可能无法脱离呼吸机。直到最后一刻,医院都在试图说服 Scott-Morgan 不要接受手术,但他坚定地决定继续前进。最终,Scott-Morgan 的医生团队和当地的 NHS 医院做出了大胆的决定:支持他的愿望,并推进对他延长生命具有里程碑意义的手术。2018 年 7 月 10 日,三台手术由多名外科医生进行,历时 3 小时 40 分钟。参与其中的每个人都惊讶地看到 Scott-Morgan 在 ICU 仅住了一天就转移到了普通外科病房,然后在术后 15 天被送回家。Scott-Morgan 自豪地说到,一篇关于该手术的医学论文被选为 2019 年度牛津医学病例报告。在三重造口术后,Scott-Morgan 立即开始计划他的下一次手术,即全喉切除术,以防止被自己的唾液呛到或无法获得足够的氧气。这是另一个激进的想法,会让 Scott-Morgan 失去发声能力,但能无限期地延长他的生命。Scott-Morgan 的麻醉师 Wright 帮助他找到了做这件事的外科医生:Philip Reece 博士,他也是德文郡当地的一名顶级耳鼻喉外科医生。Reece 同意 Wright 的观点,Scott-Morgan 应该能够过上尽可能充实的生活。在手术开始之前,Scott-Morgan 着手解决另一个问题——如何创造一种听起来像他的合成声音。他联系了语音技术研发领域的权威——Matthew Aylett 博士。他是 CereProc 的首席科学官,这家公司创建了文本转语音解决方案。CereProc 总部位于苏格兰爱丁堡,电影评论家 Roger Ebert 接受喉癌手术后曾在这家公司重建了自己的声音。使用神经文本到语音系统 CereWave AI,Aylett 博士创建了一种数字语音,听起来非常接近 Scott-Morgan 的自然语音。CereProc 通过要求演讲者以不同的方式阅读脚本,比如平静或紧张的语气,从而再现情感。随着 Scott-Morgan 的病况发展,他已经无法形成面部表情,因此他想要一个 3D 动画化身,可以表达情绪并能够说话。Aylett 的团队与 Scott-Morgan 合作录制了超过 15 小时的音频和 1000 多个单独的短语并创建了头像。2019 年 10 月 9 日,Scott-Morgan 在推特上发布了「Peter 1.0」的最后一条内容。第二天,Scott-Morgan 被推入手术室,这是英国有史以来第一次对 ALS 患者进行选择性喉切除术。自此以后,Scott-Morgan 2.0 版本诞生了。「能够用自己的音色发声完全消除了我放弃生物声音的痛苦,」Scott-Morgan 说。他的数字化身甚至可以唱歌。Scott-Morgan 的第一代化身是不会笑的。他的新 AI 化身由 Pinewood Studios 创建,这家公司为最新的星球大战电影用数字方式复制了 Carrie Fisher 的脸。新的 AI 化身能够展示他的情绪,比如大笑、微笑、眨眼,并完成他的标志性动作:抬起右眉毛。目前的挑战是实时同步,让声音、嘴唇和表情都一起工作来描绘相同的情感,这些动作对于人类来说是理所当然的。如今,Scott-Morgan 只能通过人工眼动追踪系统逐字母、逐字地进行交流。DXC 正在与 Scott-Morgan 基金会及合作伙伴共同开发一种新的上下文感知 AI 系统,该系统将从根本上改善 Peter 2.0 的语言自然度。该软件的下一次迭代将包括一个系统,该系统将从 Peter 之前的交互中学习,并为他提供适合他情况的响应。(在冻住之前,Scott-Morgan 做了激光眼科手术,让他在 70 厘米左右的距离内拥有完美的视力,也就是眼睛到电脑屏幕的距离。)Scott-Morgan 基金会设计和创新总监 Esther Duran 与英特尔人类与人工智能系统研究实验室主任 Lama Nachman 合作,帮助 Scott-Morgan 进行沟通。此前,Nachman 和她的团队开发了英特尔的辅助上下文感知工具包,这是一个软件平台,可帮助霍金通过键盘模拟、单词预测和语音合成进行交流。他们将其开源,以便开发人员可以在其基础上构建不同的功能。在霍金失去双手后,他开始使用脸颊肌肉进行交流。为他设计的计算机依赖于运行的单词列表,每当光标到达他想使用的单词或短语时,霍金就会抽动他的脸颊肌肉来选择它。这个过程极其缓慢,速度大约是每分钟一个字。Nachman 解释说,对于霍金来说,极高的准确性很重要,所以他不愿意放弃控制权。「但你如果看看 Peter,他希望与人进行自然的互动,」她说。「并不是想要看起来完全像确诊前的 Peter 1.0。他试图与 AI 系统融合,让 Peter 2.0 成为他的个性和 AI 的最佳组合。」「虽然围绕 AI 和人类的大部分对话都将两者之间的关系定位为对抗性,」她继续说到,「我更喜欢通过人与 AI 合作而不是人与 AI 竞争的视角来看待未来。」The Rebels 正在应对的下一个挑战是运动,他们正在重造人类心理和移动体验的每一个元素。DXC 正在帮助整合 Scott-Morgan 的 AI 来控制他的专用机器人轮椅,这是一种复杂的设备,正如摩根在一条推文中所说的那样:可以「大胆地去往没有轮椅去过的地方」。「与汽车相比,自动驾驶轮椅的发展具有一些明显的先发优势,」DXC 欧洲、中东和非洲首席技术官 Sukhi Gill 说。「它们主要在已知和受控的环境中运营,想想家里、花园、公园和当地商店。它们的移动速度要慢得多,而且必须应对的可能危险要少得多。通过应用汽车行业的一些知识和技术,自动驾驶轮椅代表了这个项目一个现实的中期目标。」作为乐观主义者,Scott-Morgan 说他的设想是「能够快速通过障碍赛道,或安全地通过瓷器花瓶陈列室」。与此同时,Scott-Morgan 基金会副主席兼人工智能主管 Jerry Overton 表示,一个正在进行的项目旨在为 Scott-Morgan 提供最智能的家居。「我们正在将 Peter 的家设计成一个家庭自动化设备和个人应用程序的网络。」该网络包括智能恒温器、智能灯泡、运动传感器、相机、他的头像和消息传递应用程序。「最后,我们正在使用一个绰号为 CHARLIE 的中央人工智能来调度网络,」Overton 举了一个例子:如果 Scott-Morgan 的生物传感器显示他的体温过高会发生什么。「CHARLIE 可以主动降低室温,并提醒他的医疗保健提供者可能出现的问题。」除了逆天改命的乐观主义之外,Scott-Morgan 最不寻常的地方在于,他将自己的诊断视为一种祝福,而不是一种诅咒。「现在,我们或许能够改写更多身患残疾者的未来。」他的推特简介是「科学家 - 作者 - 反叛者」,并加上了一句「用一生去改写未来」。「我本是通往死亡快车道的候选人,但我放弃了这个提议,」他补充道。「坦率地说,我还要忙着享乐呢。」原文链接:https://www.inputmag.com/culture/dr-peter-scott-morgan-als-ai-cyborg使用NVIDIA Riva快速构建企业级TTS语音合成助手
NVIDIA Riva 是一个使用 GPU 加速,能用于快速部署高性能会话式 AI 服务的 SDK,可用于快速开发语音 AI 的应用程序。Riva 的设计旨在帮助您轻松、快速地访问会话 AI 功能,开箱即用,通过一些简单的命令和 API 操作就可以快速构建高级别的 TTS 语音合成服务。
2022年1月12日19:30-21:00,本次线上分享主要介绍:- 启动 NVIDIA Riva 客户端快速实现文字转语音功能
- 使用 Python 快速搭建基于 Riva 的 TTS 语音合成服务应用
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/