当前位置: 首页 公文范文 人工智能的类比推理研究范文

人工智能的类比推理研究

发布时间:2023-09-19 11:31:12

人工智能的类比推理研究

推理是人类智能活动的重要组成部分,一直以来是人工智能研究的一个核心内容。在人的思维中,类比推理(analogical reasoning,AR)是人们利用已有知识进行推理的最常见的一种思维形式,是人类智力的一个关键现象,从古希腊时代到20 世纪一直属于哲学、逻辑学、心理学和认知科学研究的范畴。这些学科的类比推理研究旨在提供概念上的框架,阐明推理机制,找到这一思维形式存在的正当理由,从而建立其理论基础。由于类比推理通过熟悉的知识推出新知,在联想、学习和发现等认知行为中有着重要作用,因此,人工智能领域中的类比推理研究旨在结合心理学等认知科学的研究进行计算建模,在计算机上模拟实现类比推理处理过程,提高计算机系统的智能水平,产生能自动推出新知的推理和学习系统。为此,自20 世纪60 年代在人工智能领域对类比推理理论与技术开始进行研究,迄今取得了丰富的研究成果。

当前,因机器学习研究的快速进步,使得语音、文字、图像识别以及自动驾驶等技术取得突破,形成了广泛的智能化研究和应用热潮。然而,人工智能以及智能化技术要进一步发展,必须在人工智能(artificial intelligence,AI)基础理论研究上取得突破。其中,类比推理作为人的思维中的一种基本推理形式,类比推理研究将必然是人工智能理论和技术研究中的一个不可忽视的重要领域。

本文旨在对从过去到现在人工智能中的类比推理研究及其特点进行系统总结和述评。为此,本文以计算机、人工智能、逻辑、数学、信息处理以及多学科交叉等为学科类别,通过在Google-Schola、Elsevier ScienceDirect、SpringerLink、Web of Science、IEEE/IEE Electronic Library、Google、ACM、百度学术以及CNKI 等中进行检索,并对检索到的论文进一步通过其中的参考文献列表识别出遗漏的论文。截止到2021 年12 月,在学术期刊、国际学术会议、学术著作中共检索出近700 余篇(本)有关AI 领域中的类比推理研究文献。我们在对这700 余篇(本)类比推理研究文献进行全面考察的基础上,对其中具有代表性的142 篇(本)研究文献(根据系列研究、引用情况等)进行了系统分析,认为AI 中的类比推理研究在上世纪和本世纪2 时期中呈现了不同的研究特点,结合本文的研究将2 个时期中的类比推理研究归纳为8 个研究主题:“类比问题求解APS”、“计算模型”、“AR 学习”、“AR 理论”、“AR 应用”、“基于案例的推理CBR”、“AR 和CBR 理论”以及“CBR 与深度学习和可解释人工智能”;并对各研究主题及其代表性研究工作的基本研究思想、内容和特点以及存在的问题进行总结分析。最后,展望了AI 中类比推理未来的研究方向以及发展趋势。需指出,国内类比推理研究主要集中在语言学、心理学等认知科学领域,AI 中的类比推理研究在20 世纪90 年代有十几篇研究论文在国内期刊发表。其中,李波等[137-142]对类比推理计算模型和技术的研究较深入,在国内类比推理研究中具有代表性。

1 类比推理基本概念

自古希腊时代,寻找生活在多个概念环境中的2 个对象之间的共性的能力,似乎是所有科学学科中无所不在的认知过程,类比或类比推理一直被认为是人类这种认知过程中的一个关键现象。所谓类比,在字典上描述为“由2 个对象的某些相同或相似的性质,推断它们在其他性质上也有可能相同或相似的一种推理形式”。对于类比在人类思维中的作用及其意义,1945 年著名数学家Polya[1]认为:“类比贯穿于我们的思维、日常言谈、琐碎的结论、艺术的表达方式和最高的科学成就之中”。2013 年类比研究著名学者Hofstadter等[2]在专著“Surfaces and essences-analogy as the fuel and fire of thinking”中甚至认为“类比是人类认知的核心”。Polya 对数学问题求解中的启发式的研究是类比计算研究的主要思想来源,应该说他最早研究了类比推理这种推理模式的基本特征。本文可通过如下2 例理解类比推理的含义:

1)原子和太阳系类比。人们为了理解有关原子的知识,根据行星围绕太阳旋转的重力与引起电子围绕原子核旋转的引力具有相似性,从而推知“电子围绕原子核旋转”这一新知识。

2)医生为了通过病人的医学影像诊断病人所患疾病,根据患者的医学影像与已有的医疗影像库中某个或某类影像数据在属性等方面具有相似性,从而判断该患者具有同类疾病。

类比推理作为一种判断推理,没有严格的科学定义。其一般的描述性定义为:“类比推理是由于认识到新情况与已知情况在某些方面相似,从而推出它们在其他相关方面也相似的过程”,或者“类比推理是一种从关于某个或某些对象的知识(或描述),推出另外一对象的某些知识(或描述)的推理”。类比推理具有如下基本特征:

1)涉及“目标”(研究对象)和“源”(类比对象)两者,“源”依据与“目标”的某些相似性从源域中选取。

2)推断出的结论(有关“目标”的知识)具有或然性,不具有唯一性。

类比推理的基本特征决定了类比推理的理论与技术研究具有多样性、困难性和复杂性。类比推理首先面临的是如何根据目标有效地找到合适的源,这涉及相似性求解和检索问题;然后要有保证类比结论有足够可靠性的推理机制,以及有效实现这种推理机制的计算模型;由于通过类比推理推断出的结论是关于目标的新知,具有或然性,因而还需验证结论的可靠性。

类比推理是一个多步骤推理过程,这种推理过程应该具有哪些子过程,研究者们[3-8]的认识不尽相同。对它们进行归纳至少应包括如下子过程:

1)检索(Retrieval):根据目标,在源域中找到一个与之相似的类比对象。这个过程注重目标与源在属性等方面的相似性及其计算,给定检索方法并能由此在源域中检索一个(或多个)与目标相似的源。

2)映射(Mapping):确定源与目标的“相似元素”(概念、属性、关系等)之间的对应关系,给定映射约束条件,将选定的相似元素从源映像到目标。

3)转换(Transfer):在建立的映射下,通过对映射进行进一步处理,从而得到结论(有关目标的新知识)。

4)正当性(Justification):验证结论(目标新知识)的可靠性。

2 AI 中早期类比推理主要研究和特点

AI 领域中的类比推理研究,自1964 年Evans[9-10] 的开创性工作到20 世纪末,类比推理的理论与技术研究成果丰硕(约120 余篇发表文献)。这一时期中的类比推理研究,可归纳为4 个研究主题:类比问题求解APS、计算模型、类比推理学习和类比推理理论。图2 为这一时期类比推理研究文献在各研究主题中的占比。

2.1 类比问题求解和计算模型研究

在日常生活中,人们通过类比用过去已解问题的知识来帮助解决新问题是一种普遍存在的推理形式。因此,如何在计算机上实现这样的问题解决,称为“类比问题求解(analogical problemsolving,APS)”。APS 可描述如下:给定一个目标问题作为输入,输出该问题的一个解,该解由已知的其他问题的解导出。1964 年Evans[9-10] 第1 个从AI 的角度出发,研究了几何类比问题求解及其计算模型。提出类比推理的一种多阶段计算模型(multi-stage computational model of AR,CMAR),以及机器已实现的几何类比问题求解系统(system to solve geometric-analogy problems,SSGA)。Evans 开创了AI 中类比推理的计算模型研究,通过CMAR 详细说明了检索−映射−转换−正当性的类比推理基本处理过程。CMAR 还捕获了类比推理的一个重要特征:源和目标之间的映射可以在某种抽象级别上执行[3]。

与Evans 的研究目的相同,如何在计算机上实现人在数学定理证明中常用的类比推理,1971年Kling[11-12] 研究了定理证明中的类比问题求解及其计算模型。提出一种在解析定理证明中的类比问题求解方法:使用类比来减少解决新问题所需的数据库的大小,数据库将限于证明类似定理所需要的那些公理和事实,然后约束数据库将加快对新定理的搜索。基于该方法,Kling 提出了一个已实现的系统ZORBA,这是一个通过详细说明用户提供的源证明来辅助目标定理的自动证明系统,系统使用其证明中提供的定理和从句(公理或证明定理)来选择一组接近最优的起始子句,以用于目标定理的证明。尤为重要的是,Kling对APS 提出了一种一般性方法,即用求解源问题的方案来指导目标问题的求解。以该方法思想为基础,在随后的类比推理研究发展中形成了一个重要的研究领域即基于案例的推理(case-based reasoning,CBR)。

诸如上述各种具体APS 及其计算模型的研究各有侧重,没有研究一般形式的APS 计算模型。对此,Carbonell[13-17] 研究提出一种APS 的统一计算模型:转换类比(transformational analogy,TA)。TA 的核心思想是使用转换操作符、将目标问题的解转化为源问题来解决。转换过程被视为一个问题求解的过程,在一个空间(称为“转换空间”或“T-空间”)中寻找新问题的可能解决方案。然而TA 存在如下问题:TA 中使用T-算子将一个解转换成另一个解中没有限制这些运算符的应用,因此任何解都可以通过应用足够数量的这些运算符转换成任何其他解,模型并没有解决如何从一开始就找到一个可能相似的源解等。对此,Carbonell [16-17]进一步研究提出衍生类比(derivational analogy,DA)。DA 更能恰当地捕获潜在相似源问题的检索,并且能够将解决一个问题的大部分基本计划移植到解决另一个问题上,那么这2 个问题将被视为潜在的相似问题。

除上述APS 及其计算模型研究外,对于类比推理一般计算框架,Kedar[3] 研究提出类比推理的统一计算模型UCMAR(unifying computational model of analogical reasoning)。UCMAR 明确了17 个要求及5 个组成成分(子过程),指出当前类比推理计算模型研究的局限性等。

2.2 类比推理学习研究

通过类比学习知识是人类学习的一种重要方式。如何在计算机上通过类比推理进行学习,1978 年Winston[18-21] 开创了类比推理学习的研究。Winston 研究了如何从先例和练习、功能定义和示例中通过类比推理进行知识学习,类比推理学习的主要方案是引导学习,关注一个人在学习过程中如何在2 个领域的知识之间建立对应,通过提出的一种迁移框架进行概念学习,强调计算和系统实现,并提出了一个描述性学习系统。

在通过类比推理学习的过程中,对一些知识只进行一次类比推理学习可能存在错误,需要多层次或重叠的类比学习。对此,自1983 年Burstein[22-24]研究了通过教授式类比推理学习理解计算机程序设计语言BASIC 中赋值语句的计算模型,提出一种通过多重类比推理进行概念学习的系统(concept learning by multiple analogical reasoning,CLAR)。CLAR 的中心思想是通过对熟悉的对象和情景进行多重类比,模拟在BASIC 中教授学生概念。CLAR提供了一个学习模型,通过使用多重、重叠的类比来建立目标领域的因果表示。给定一个教学类比及其用法的示例,系统将识别一个特定的关系抽象,以便在类比过程中使用。除上述研究外,研究者还提出了一种以理解的特定能力使用类比来进行某种学习和推理的方法[15],基于抽象的有用类比推理理解类比学习[25]等。

2.3 类比推理理论及其计算模型研究

人们已认识到类比推理的基本过程至少包括4 个子过程(检索、映射、转换和正当性),其中如何从源到目标的映射在类比推理计算模型研究中是一核心问题。在这一时期中,对此研究产生的“结构映射理论 (structure mapping theory of analogy,SMT)及其计算模型”和“约束满足理论(constraintsatisfaction theory,CST)及其计算模型”,是迄今类比推理理论和计算模型研究中具有重大影响的成果。

2.3.1 结构映射理论SMT 及其计算模型SME

如何建立从源到目标的映射,自1980 年Gentner等 [26-28] 研究提出结构映射理论。SMT 关注类比对象的关系结构的共同性,这一共同性独立于这些关系所在的对象域(源域和目标域)。SMT 中的知识表征只根据知识的句法而不依赖内容,源到目标的映射被抽象到与领域无关的层次上描述,并以系统性原则约束映射。由此,SMT 具有如下特点:人类智能中的类比是将一种范围(即源域)知识映射到另一种范围(即目标域);源映射到目标是将源域对象具有的结构关系(低级关系)映射到目标域;类比对象的属性不发生映射;映射遵循所提出的系统性原则,映射低级关系的选择限制条件构成相互联系的关系系统,低级关系的映射受高级关系的限制;在不同情况下映射的内容完全取决于知识表示的句法属性,而与领域的具体内容或要实现的目标内容无关;其中,结构映射过程最主要的环节就是系统性原则。映射源域到目标域的低级关系(一阶谓词)受具有推理意义的高层次关系(高阶谓词)的支配而不受孤立的谓项支配,因而系统化原则可以约束任何类比的源和目标之间的映射。

Gentner 等[29-30]进一步研究提出了SMT 的一个计算模型结构映射引擎(structure-mapping engine,SME),SME 是一个运用SMT 并在计算机上已实现的类比推理系统。SME 应用结构映射理论,更好地理解处理句法如何控制映射的方式。SME 能匹配源描述与目标描述的组成部分(关系、属性和函数)之间的对应关系、一组根据映射得到的关于目标的候选推论,从句法上检测每一组整体匹配并予评分。

2.3.2 约束满足理论CST 及其计算模型

在类比推理中,映射确定了源与目标的“相似元素”(概念、属性、关系等)之间的对应关系,所以这样的从源到目标的映射不具有唯一性。对于类比推理来说,哪些映射适合或不适合将正确的源知识转移到目标是至关重要的。因此,约束从源到目标的映射在类比推理研究中已形成主要共识。在以往的研究中提出的约束方案有:强调结构约束的系统性约束映射[19,23],将映射约束为属于源和目标共享的抽象的那些关系[10,25,31],或者仅通过目标中的一致性来限制映射[11,30],以及从误差分析到使用多重类比的在目标域内证明和调试映射[15,28]。Hall[5]将类比映射的约束分为3 类:保留源描述的关系结构,保留先验确定的语义类别以及保留推理上下文相关的材料。每种约束类都引入了首选项,这些首选项限制了类比映射的详细描述。Holyoak 等[32-33]对类比推理中映射子过程的研究融合了以上3 类类比映射约束思想,提出了一种新的基于同构性、语义相似性和语用中心性约束的源与目标之间的类比映射约束满足理论。对于CST,他们研究提出2 个计算模型:类比约束映射引擎(analogical constraint mapping engine,ACME)[34-35] 和约束满足类比检索(analog retrieval by constraint satisfaction,ARCS) [36],并且ACME 和ARCS(LISP 程序)均在计算机上实现。

CST 的基本思想是从记忆中提取类比应由同时满足语义相似性、结构一致性和语用中心性的约束共同决定,当目标类比以待解决的问题、要给出的解释或要得出的结论的形式呈现时,通过在记忆中搜索语义、结构和语用上的相似物,在记忆中找到潜在有用的源类比。

ACME 在计算机上实现了CST 关于映射的3种约束性,从而展示了这些约束的一般适用性。ACME 的中心思想是通过一个支持和竞争的假设网络来表示以映射哪些元素的约束,一个并行约束满足的协作算法识别映射假设,这些假设共同表示了最适合交互约束的总体映射。ACME 已经被应用到一系列的实例中,包括问题类比、解释性类比、故事类比、形式类比等,ACME 应用结果与心理学实验获得较好的一致性。ARCS 以知识图谱WordNet 为基础,根据3 种约束条件检索与目标结构最相似的源结构。当发现源域中潜在的相似结构时,通过使用标准的并行连接松弛算法(parallel connectionist relaxation algorithm,PCRA),表示出各种源结构与目标结构的相对对应关系。ARCS 表明,语义、同构和语用3 种约束在AR 的检索、映射和转换3 个不同子过程中的重要性,如表1 所示。

3 AI 中早期类比推理研究的总结与分析

由于类比推理是智能的核心,人工智能应该尝试理解这种现象,并对其进行计算建模,这符合人工智能的科学目标。为此,在20 世纪中,研究者们主要在类比问题求解和计算模型、类比推理学习、类比推理理论和计算模型以及计算机实现等方面做了不懈努力,取得了丰硕成果。本文从6 个方面简要地总结分析了这一时期AI 中类比推理研究的主要特点(表2)。这一时期人们已认识到AI 中类比推理研究的思想、理论和方法应该具有可计算性[5],但由于AI 中的类比推理研究涉及心理学等认知科学以及数学和计算机等相关学科,类比研究对象多样化(如:实体或概念、事物描述、系统结构等),以及类比推理的推断结果具有或然性而不具有唯一性,所以决定了类比推理的理论和技术研究比其他推理形式研究更具有复杂性和困难性。这样的复杂性和困难性致使类比推理至今仍未形成完整而系统的理论和技术,也影响了进入21 世纪后AI 中类比推理研究主题的变化、特点和发展趋势。

作者:潘正华 王勇 单位:江南大学理学院