酷应用

人工智能如何获得知识？

百家作者：人工智能学家 2020-04-13 20:08:14

原发：人民论坛·学术前沿 2019年21期

转自：南京大学哲学系

摘要：人构造概念以认识世界，人的认知与人的身体密切相关。计算机是人类心灵的延伸；而人类发明的各种认知用仪器（机器）是人类感官的延伸，它们是数据形成函数。因此，我们可以将人类的概念嵌入到计算机之中让它概念化世界，同时连接人造的感知系统以数据化世界，从而实现人工智能。这样的人工智能是拟人类的或者准人类的，它们能够“像”人那样获得外部世界的知识。由于嵌入进计算机的概念是人类的，人造感知系统即数据形成函数也是基于人类的科学理论的，这样的人工智能所获得的知识也是人能够理解的。

关键词：人工智能；知识形成函数；概念化世界；感知系统

导言

我们通过观察与思考获得外部世界的知识，然而我们的观察能力及理性思考能力都是有限的。我们用计算机完成繁重的甚至原则上无法完成的计算任务，我们用显微镜、望远镜观察我们肉眼看不到的东西……机器（包括仪器）在我们的认识过程中的作用巨大，它可以看成是人感官和心灵的延伸。随着计算机算力的提高、高效算法的提出以及作为算料的大数据的涌现，围绕人工智能的相关技术正深刻地改变着社会的生活及生产方式。智能型机器能否代替以及在何种程度上代替人的心灵，成了人们的热点话题。人工智能作为计算机科学的分支被定义为研究如何制造计算机并为其编程，使其能做人类心灵所能做的那些事情。对于人类的智能而言，我们能够认识世界，即获得关于世界的知识，人类制造的人工智能（机器）能够认识世界吗？如果它能够认识世界，如何理解它的认知行为？如果不能，它的边界在哪里？

在当前人工智能的研究领域中知识表示与推理、机器（深度）学习等概念被人们频繁使用；在人工智能的实践领域，机器能够碾压人类棋手，无人机能够对拍到的照片进行处理并作出判断……于是，自然的问题便是，人工智能体，或者说机器，能够拥有或者学习“知识”吗？有人会说，这是一种类比用法或者是含混的用法而已，机器不可能拥有人那样的“知识”；而在另外的一些人看来，机器能够有弱人工智能意义上的智能，因而机器能够有智能但不能拥有知识这是难以接受的结论。本文将论证，机器以“拟人类”或者“准人类”的方式存在于认知世界，能够对人类概念进行操作并且在概念化完备的世界中能够完美地进行操作，但是需要构建与世界联系的通道、发展拟人的感知系统，从而让机器像人那样感知世界。

人工智能如何嵌入世界？

知道是人的一种心智状态，它是一个命题态度；某人知道某个命题，该命题构成了他或者她的知识。知识被认为是得到证成的真信念（justified true belief），这是被广泛接受的定义，尽管它招致盖提尔难题的困扰。这里“证成”是一个给出理由的过程或行为，“真的”（true）是一个形而上学概念，而“信念”（belief）则是人的心灵中对命题的某个内在状态。“真”是无法被观察到的命题的性质，它作为知识的要素被质疑；至于证成，没有一个统一的标准评判一个信念如何得到证成。而知识是相关主体的一种内在的认知态度，则是没有什么异议的。

根据知识的这个定义，今天的计算机，它作为机器，尽管能力很强，却不能“拥有”知识。因为机器没有“真”这个概念；因不能理解证成的含义的机器也无法证成一个命题，尽管机器能够给出命题之间的逻辑关系；尤其重要的是机器难以有人类的信念。这种看法是合理的，尽管它是人类中心主义的。

我们的认知与我们的身体行为是双向互动的。一方面，我们的认知影响我们的行动，从而影响我们的身体行为。布鲁诺宁愿被烧死也不放弃日心说；我不喝高糖饮料，因为我相信高糖饮料会使我的血糖增高。另外一方面，我们的身体行为影响我们的认知。根据涉身认知理论，我们通过嵌入到环境的身体认知这个世界：人的认知过程进行的方式和步骤实际上是被身体的生物属性所决定的，人的认知的内容也是身体提供的。莱考夫（G. Lakoff）和约翰逊（M. Johnson）在《我们赖以生存的隐喻》中认为，人们对身体的主观感受和身体在活动中的体验为语言和思想部分地提供了基础内容；认知就是身体作用于物理、文化世界时发生的东西。

计算机的核心是执行着由人类指令而组成的程序，即软件；而芯片等硬件系统只是执行程序的物理基础，即硬件，这里的软件不构成计算机程序嵌入到世界中的身体。因而计算机不可能拥有人类那样的信念。而那种执行人类非计算功能的机器比如汽车、空调等也不可能拥有信念。

然而，并非所有人都认同机器不能拥有信念。比如在人工智能专家麦卡锡看来，几乎所有能够解决问题的机器都可以说具有信念，甚至像恒温器那样简单的机器都可以说具有信念，“我的恒温器具有三种信念——这里太热，这里太冷，这里温度适宜”。（［美］约翰·塞尔：《心、脑与科学》，上海译文出版社，2006年，第22、23页。）这当然是塞尔所不能赞同的，也是本人不能赞同的：机器没有心灵，何谈信念？

机器是人的感官的延伸，它的认知也是拟人化的。其实人类一直无意识地在“认识自己”，而无需苏格拉底的训诫。人认识自身的局限，并试图克服人的局限。机器便是人类认识与克服自身的局限而发展起来的。与其他人类发明不同，计算机被人类发明出来是为了帮助人们减轻人类的脑力劳动，它们是为了弥补大脑的局限而发明的。德国哲学家卡普（E. Kapp）提出了器官投影说——工具作为技术的物化形态是人体器官向大自然的投影或者延伸，从这个意义上说，无论是计算机的前身如巴贝奇的差分机，还是现代高速运转的大型计算机，它们都是人类大脑或者心灵的延伸。当然，人们担心作为人类心灵延伸的计算机能够发展到“拥有”自主的心灵而与人类对抗乃至淘汰人类。

今天的机器能够进行计算以及演绎和归纳推理。计算是计算机被最初赋予的功能。今天人们不会惊讶于机器算出复杂的数学题，如让计算机算出圆周率的小数点后1000位乃至更难的工作；对此，我们认为这是再平常不过的事情，而如果某个人能够做到这样的计算，他或她反而会被认为是天才。对数学方程，我们需要求得它们的“演绎解”或“解析解”，我们也有许多这方面的定理；然而，对复杂的数学问题，我们往往难以甚至不可能给出这样的“解析解”。于是，“计算解”应运而生。计算机帮助我们得到这个计算解。一个计算解往往是“近似解”，这样的近似解相对于某个需求是满意的。在工程中我们需要在有限的时间中得到一个这样的满意解，而不指望数学家没完没了地寻求解析解的推理。今天的科学研究中“计算”“理论”与“实验”已是三足鼎立。

计算机能够做演绎推理——从前提必然地得到结论。计算机能够进行机械化定理“证明”工作。在这个领域中计算机能够“证明”出人类不能得到或者难以得到的数学定理，如四色定理。在机械化数学定理证明领域中有“证明检验”“证明发现”和“猜想生成”三个方面。证明检验是给出一个推理D以从大量的前提中得出结论P，来判断D是否合理；证明发现：给出大量前提和一个假定的结论P，判断P是否是逻辑后承，如果是，给出形式证明；而猜想生成：给出大量前提和一个由前提逻辑推导出的有趣的结论P，并给出证明。这三个方面的难度是逐渐递增的。在前两个方面，人们利用计算机作出了许多卓越成就。机器能够做归纳推理。所谓的数据挖掘工作便是人们用计算机做基于大数据上的归纳推理；基于海量数据上的挖掘工作是单个人所不能或者难以完成的。在复杂的博弈与决策问题方面上，如下围棋，机器通过学习能够给出行动策略且比人做得好得多，此时机器是在做基于归纳推理上的策略选择。机器这里所做的归纳推理是在完全概念化的世界中进行的，而不是在现实世界之中进行的——如果在现实世界之中机器也能够做这样的归纳推理，那么机器便是科学家了。正因为机器能够做这些复杂条件下的推理与决策，计算机的行为越来越“表现”出像有智能的样子来。

如何理解计算机的这些能力？人们普遍同意，机器之所以能够做这些工作依靠的是人类设计的程序。程序是一系列人类指令，能够设计程序是人类的一种智能。人类通过让机器执行人类设计的程序以解决我们难以做到或原则上做不到的事情。如果认为机器具有了“少许智能”，那么随着时间的推移，机器的智能会越来越强，这样，人类制造出一台超级智能（ultraintelligent）的机器便是可能的，该超级智能机器能够完成人类的所有智能性行为。此时便会发生智能爆炸（intelligence explosion）。超级智能机器是人类的最后发明，因为设计机器是人类的智能之一，该机器能够设计机器并且比人类设计得更好。这便是古德（I. J. Good）在1965年所提出的观点。智能爆炸就是所谓的技术奇点。

对于这些计算机能够做的，人们可能不认为它是在真正的计算与推理，当然更谈不上有智能了。机器能够从“人有死”“苏格拉底是人”得到“苏格拉底有死”这样的命题，但是它根本不“理解”自己的行为、也不知道自己在干什么，何来推理？对人类来说，“理解”是各种行动包括推理的前提，那些不是基于理解基础上的行为只是肉体的条件反射动作而已、而不是自主的行动；若没有理解，甚至一些简单的非条件反射的前后相继的动作都难以完成。但是，要求机器有理解能力即是要求机器有一个心灵，这又回到了机器能否有心灵的问题上来。塞尔说：“计算机程序永不可能替代人心，其理由很简单：计算机的程序只是语法的，而心不仅仅是语法的。心是语义的，就是说，人心不仅仅是一个形式结构，它是有内容的。”（［美］约翰·塞尔：《心、脑与科学》，上海译文出版社，2006年，第22、23页。）即在塞尔看来，强人工智能是不可能的。但是，机器能够“表现”得像有心灵那样，即我们能够实现弱人工智能。

笔者认为，计算机的计算与推理可以看成是“准计算”与“准推理”的。人类通过与外界的长期交流而获得概念与理论，它们被输入计算机后被计算机所操作，尽管计算机所做的只是进行语形操作、而不知道语义，但人心是知道语义的。

机器能够被认为是有意向性的，尽管机器没有心灵，也没有严格意义上的信念与知识。人类给机器嵌入了人类的知识，通过程序让机器实现人的意志。不仅仅如此，程序中包含了意向性。一个执行中的计算机程序是有意向性的。这个意向性是指程序指向它需要的数据、运算对象以及运行结束后输出的数据，而对其他数据置之不理。机器的意向性是人类移植给它的，这是一种“次级意向性”，或者说“类人意向性”。当人们做一个复杂的计算，比如122*122=14424时，人们的意向性指向这些数字、运算以及整个命题，等等，而当人们用一个编制的程序运算时，人们只需输入他们要执行的任务，那个最终结果就会被程序计算出来。人们本来要进行的意向性的活动被机器所取代。人们运用程序完成了一个复杂的意向性心智活动；就目前而言计算机要人类的启动才能运行，且它的过程是人类所理解的。一旦计算机的意向性不依赖于人类，或者生成了自主的或者独立于人类设计者的意向性，它就获得了意识，这才是我们应该担忧的。

人们努力实现人工智能，然而现有的人工智能是无身的。符号主义的人工智能试图通过符号及其运算，在物理系统上实现智能，物理系统是运算进行的载体，而不是与世界进行因果关联的通道。这样的人工智能因而是无身的。联结主义的人工智能向前进了一步，计算机通过模仿人的神经系统的学习机制，在它能够数据化的或者已经数据化的“世界”中快速地学习，从而实现智能；这样的人工智能同样是无身的，它同样不是因果地感知这个世界。

在笔者看来，如何让人工智能机器嵌入到世界之中从而“感知”世界？这是人工智能的一个任务。

建造人工感知系统

不久前，美国太空探索技术公司首席执行官埃隆·马斯克宣布计划明年年底前（2020年）实现将芯片植入到人脑之中，以提升大脑的能力。更早些时候浙江大学推出了“双脑计划”，即推进大脑与电脑的融合性研究。这样的脑机融合或人机融合的研究与实施不仅仅面临技术问题，同时面临伦理问题。但无论脑机融合研究的前景如何，这项研究预设了人的生物大脑及人的感官系统在感知世界中的价值。

人工智能是计算机科学的分支，因而，在感知世界中存在另外一条比上述脑机融合更可行的路径：为计算机建造人工感知系统。

人类在认识世界的过程中发明了许多仪器或机器，以延伸人的感官。自伽利略发明了望远镜后天文学得到急速发展，天文学上的（射电）望远镜以及医学生物学中的高倍显微镜等各种仪器，大大地拓宽了人们的“感知范围”。计算机是人类心灵的延伸，而对于感官延伸的各种仪器（机器），我们统称它们为“感知仪器（机器）”。

对于人类而言，人类获得知识的方式或者通过感觉经验或者通过推理。我到了一个从没有去过的城市，比如纽约，我们不知道如何去纽约大学，我向四周张望，那不是纽约大学的标志吗？我看到了纽约大学的某座教学楼。我很幸运。通过观察解决问题的机会不会很多。我记得纽约大学在曼哈顿，而我现在不在纽约的下城，因此，我得去纽约的下城。这便是推理。当然还有一个比直接观察和推理更快捷和有效的解决问题的方式：询问当地人，这便是通过证言的方式。在证言解决问题的方式中同时要运用观察与推理:根据我的观察，我判断出，我要询问的对象是个可信的人，他或她的行为举止使得我相信他或她是本地人，而不是像我一样的外地人……然而，当人类与自然打交道的时候，人类的感官是有限的，需要仪器或者机器帮助我们认识世界。

我们可以感受到天气的寒冷与炎热，但我们的感官不能给出天气温度的细微区别，于是我们发明了能够定量确定温度的温度计。温度计不是自然之中的物体，它是被我们制造出来的人工物。我们规定了在一个大气压下水的沸点是100摄氏度、水结冰时的温度是0摄氏度。我们知道水银随外界温度“线性”膨胀的现象，它在一定的高温不会气化、一定的低温不会结冰。利用这样的现象我们便制造出温度计来：温度计在一个大气压下水沸腾时温度的刻度显示为100摄氏度，而在水结冰时的温度刻度显示为0摄氏度。我们看到，一个温度计的制造以及背后是一系列物理理论做支撑。事实上，我们制造的任何仪器或机器其背后都有可靠的理论做支撑。

人类发明的许多仪器或机器，它们与温度计一样，以自己的方式建构外部世界的现象。它们是被制造出来的以获得外部客观的数据。作为触觉的延伸的温度计是被建造出来的，但是这不代表它所测得的温度不是客观的。我的体温被测出是38°C，于是“我当下的体温是38°C”便是一个客观事实。我确认温度计是好的、我的测量方式也是正确的，我得到了“我的体温是38℃”这样的事实，于是，我知道我发烧了。建构主义者说，我的体温这样的事实是被建构出来的。事实被建构不等于说事实是主观的，客观事实只有通过建构才能被我们所认识。

理论及相应的仪器（机器）将客观世界的某些本体意义上的事实“转换”成我们需要的事实或知识。我们这里有两种事实，本体意义上的事实和认识论意义上的事实。外部世界的本体意义上的事实，它们只有被测出才有认识意义；而一旦被测出，它便成了认识论意义上的事实了，如果我们承认被测出的是事实的话。本体意义上的事实便是康德所说的“物自体”，而我们概念化的是“现象”。我们用理论来说明所观察到的现象。这里的现象是指特定种类的事件或过程，它在特定的环境中有规则地出现。不仅如此，哈金说：“科学家经常创造现象，随后这些现象称为理论的核心部分。”（［加］伊恩·哈金：《表征与现象》，北京：科学出版社，2011年，第176页。）而科学家是通过仪器创造现象的。当然，这是可值得探讨的问题：仪器（机器）所制造出的现象到底是什么？

仪器（机器）及背后的理论构成“翻译函数”，或者更准确地说“数据或者事实形成函数”。这个函数是事实到数据的一个映射。即仪器（或者机器）给我们的是我们能够读得懂的数据，或者说仪器（或机器）将获得的外部世界的事实加工后的用我们的概念表达后的“事实”。这是一个“翻译”或者“转换”过程。仪器或者机器是翻译函数的具体化。不同的仪器或机器所涉及的自然现象是不同的，因而是不同的翻译函数。事实上，我们人类的感知系统便是这样一个函数：将对环境的感知转换为概念化的认识（数据）。

受过一定教育的人能够读懂体温计上的水银所处位置的含义，而只有相关专业的医生才能看懂X光片上的斑点代表着什么。这些感知仪器（机器）的一端是自然现象，另外一端则是我们人类自身。感知仪器（机器）是“无心”的，它们只是我们感官的延伸，它们自身无法给出关于这个世界的概念化的认知。而能够自带感知仪器（机器）并能够读懂仪器所得到的数据的人工智能机器正是我们需要的，这样的人工智能的感知仪器构成获取外部世界数据的因果通道。

准人类：延伸的心灵与延伸的感官的结合

我们上面分析，即使被认为具有智能的计算机其本身也是无身的，而认知用仪器（机器）是无心的。我们可以将两者结合起来，这样的机器是“拟人的机器”。

我看一眼窗外自言自语地说：今天阳光很好，温度适宜。我在电话中告诉在外地的亲友，他们听到我这么说能够明白我的意思。这里，我用语言表达出我所感知到的东西，我与亲友因共享的语言而能够相互理解。一台装有摄像机、温度探测仪的机器，它的温度显示仪上可以显示为20℃、它也可以拍摄到阳光的照片，但是，它得不出“今天阳光很好，温度宜人”的结论。因为这里所涉及的“今天”“阳光”“很好”“温度”“宜人”都是人构建的且与人的身体有关的概念，而机器无法使用这些概念。

人类用理论去“看”世界。我们对世界的事物施以名称，然后将名称与一些概念相联系，从而构建信念或知识以认识世界。名称有含义与指称；我们通过含义进行思维，而通过指称，将我们的思维对象与世界联系起来——“太阳是红色的”；这里，太阳是专名，红色则是概念。概念是事物属性在思维中的把握。人在认识世界时将概念作为事物的属性赋予事物。

人的已有认知决定人的观察。科学哲学家汉森在《发现的模式》中揭示了观察的理论负载性（theory-laden）——每一个观察的术语和观察语句都是负载着理论的，没有纯粹中立的、独立于理论的观察。库恩（T.Kuhn）则认为科学家公共体所共有的范式决定着观察。“操作和测量当然部分源自于直接经验，但更为明显的是它们有范式所决定。”（［美］托马斯·库恩：《科学革命的结构》，北京大学出版社，2003年，第114页。）这些哲学洞察告诉我们，我们在建造人工智能时要在其“心”中存放用来观察世界的理论。

一个通常的计算机程序是，构建某个知识库然后嵌入到机器之中，利用某些算法以应对各种可能的问题或者任务。对于机器而言，知识是被嵌入的（embedded）——当然，人类的先验性知识也可以看成是嵌入的。机器可以根据这些嵌入的知识以及被嵌入的推理规则进行推理。一个医疗专家系统能够根据患者的症状做出诊断并开药方，这是模仿医生的看病过程，它的输入是人类概念化后的信息，而不是来自于外部世界即时的信息。这样的系统是“无身的”，因而是一个与世界隔离的系统。

自然界中没有听者便没有声音而只有振动，我们的听觉系统将其中部分振动转换成声音。我听到了超过100分贝的声音，我忽然感到这个声音不是噪音，而是“I am a machine（我是一台机器）”——因为我学了英语。从空气的振动中得到某些句子便是“计算机听觉”系统所要完成的，同时我们需要创造其他的“计算机知觉”系统。一个具有计算机知觉的认知系统能够像人一样，与世界进行交流，从而将外部刺激转换成认知。

对于人而言，根据物理学原理造出温度计及其他复杂的认知仪器（机器）能够获得外部世界的某些数据，科学家根据这些数据给出相应的判断。一个自然的想法是，我们能够进一步地构建人工智能，将人工智能与这些感知系统（认知仪器）连接，将数据直接变成结论；此时的带有感知系统的人工智能完全代替了科学家的工作。这样的机器要做得像科学家一样，它本身得拥有人类的知识体现。人工智能与感知系统构成一个拟人化的人工智能体。这样，一个与世界有交流的拟人化机器含有人类概念化的系统，它能够对它所“观察”得到的数据进行加工以形成知识。

这样的人工智能体是一个“准人类”甚至“超人类”。想象一下，这样的智能体到太空中某个星球上通过信号“告知”我们，那儿有一种类似水的东西，外表与地球上的水完全一样，但其结构不是氢二氧一。它的观察方式是我们能够理解的，因而它告知我们的结论也是我们能够想象的。我们也可以想象一个这样的人工智能医生，它是电脑与X光机的结合，它一“看”病人，就能马上告诉我们病人的肺部情况，是有病还是没病，如果有病，是什么类型的病以及病的严重程度。这样的人工智能医生的医学水平能够比人类的医生的水平还要高。我们能够理解并相信它们的观察或者结论。

结语

世界就在那里，生物体感知世界的方式千差万别；对于人类而言，认识世界即是以自己特有的方式感知它、体认它。发展基于人的认知世界的人工智能也是人类认知世界的一个方式。

计算机能够对人类的概念进行操作，而一旦它有自己的感知系统，它便能够像人类那样，用嵌入的概念与知识去认识世界并形成相应的认知或判断。它是一个准人类或拟人类。它的感知系统是我们人类根据某个科学理论建造的，它所得到的现象或者数据是“制造出来的”，因而能够为人类所理解。这样的感知系统是一个翻译函数，它所接受到来自于自然的刺激（输入）在感知系统上形成一个输出（数据），计算机对这个数据进行“解读”从而形成某个“信念”。它也可以对这个“信念”进行证成，比如使用其他场合下的数据给予支持，等等。这样，它便能够为我们提供可靠的数据（知识），我们也能够理解这些数据。

然而，人类的创造性不在于提供新的关于外部世界的知识，而往往体现在形成新的概念（观念）。具有人造感知系统的人工智能系统其拥有的概念是我们赋予的，它们能够为我们提供我们能够理解的知识，但是由于它们没有形成新概念的能力，因而它们不具有创造性。这是一个有点草率的结论，需要进一步的论证。

需要说明的是，本文只是探讨作为“个体机器”的人工智能机器获取知识的问题，事实上，人、计算机以及人工探测设备通过连接已经形成了巨大的“超级智能体”，这里的连接便是我们熟悉的互联网以及不怎么熟悉的物联网。这样的超级智能体在迅速发展。《崛起的超级智能》一书作者刘锋提出以互联网大脑模型来研究这个超级智能体：“互联网大脑具备不断成熟的类脑视觉、听觉、感觉、运动、记忆、中枢和自主神经系统。”（刘锋：《崛起的超级智能》，北京：中信出版社，2019年，第8页。）这样的超级智能体通过云反射弧实现对世界的认知、判断、决策、反馈和改造。这个超级智能体如何认识世界？这涉及“人机群集智能”的认识论问题；对之，本文不作探讨。

作者简介：潘天群，南京大学哲学系教授、博导，南京大学科学技术与社会研究所所长。研究方向为科学技术哲学、人工智能哲学、逻辑学、西方哲学、博弈论及其应用等。主要著作有《行动科学方法论导论》《博弈生存——社会现象的博弈论解读》《社会决策的逻辑结构研究》等。

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）云脑研究计划，构建互联网（城市）云脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。

??如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”