1.2 人工智能的前世今生

1.2.1 人工智能的基础

人类智慧的出现改变了这个星球的发展轨迹,文字的出现又让知识积淀能力大大增强,记录下了人类智慧的历史。尽管现代人工智能的能力越来越强大,但是人工智能的渊源来自人类智慧。

1.哲学

早在 2400 多年前,人类历史上的先贤就已经在深入思考与探索人类智慧。知识从哪里来?知识是如何导致行动的?精神的意识是如何从物质的大脑中产生出来的?直到现在,面对这些深入性的问题,科学家们依然在不断探索、寻求更合理的论证与解释。

亚里士多德(Aristotle,公元前384—公元前322)是第一位探究思想意识与理性推理的科学家(见图 1-5),他将三段论用于推理,第一次利用初始条件机械地推导结论。这标志着哲学的诞生。随后,人类在蒙昧中探索了一千多年,直到文艺复兴时期,人类思想又得到了一次大解放。罗蒙(Ramon Lull,?—1315)第一个提出推理可以用机械装置完成。托马斯(Thomas Hobbes,1588—1679)提出推理思维如同数字计算,是“在寂静的思维中加加减减”。在1500年左右,达·芬奇(Da Vinci,1452—1519)设计了机械计算器,即使当时未能成功,现在证明达·芬奇的设计也是可行的。

随后世界哲学的发展渐入高潮,涌现出一批优秀的哲学家,如勒内·笛卡儿(Descartes,1596—1650)第一个提出了二元论,将精神意识与物质清晰地区别开来;大卫·休谟(David Hume,1711—1776)提出了沿用至今一直常用的归纳原理,意识终于与知识用逻辑联系起来并且知识可以通过实验抽取,最后精神意识的哲学元素将知识与行动联系起来。因为AI智能表现形式不仅需要推理也需要行动,只有明白如何判断行动的正确性,我们才能理解如何构建拥有正确行为、行动的智能体。在这个问题上,亚里士多德辩称行动是通过目标与关于行动结果的知识之间的逻辑联系判定的。在《尼各马科伦理学》(Nicomanchean Ethics)一本中也用一个例子解释道:……我需要遮盖物,斗篷是遮盖物,故我需要斗篷。我需要的,我必须制作,我需要斗篷,故我必须制作斗篷。结论“我必须制作斗篷”是一个行动。

图1-5 世界历史上著名的哲学家亚里士多德与笛卡儿

亚里士多德提出的基于目标的分析在之后的应用中被证明是很有用的,例如,现代回归规划系统的应用已经成功应用在GPS程序中。但是目前没有一个解释能够说明当有多个行动可达到目标时,或者没有行动可达到目标时,该如何办?在这种情况下的决策需要为行动制定一个定量规则,这也是现在决策理论中重点研究讨论的。

2.数学

在上文中,哲学家们给出了 AI 大部分重要思想的标志,例如,意识与理性推理、意识与知识的逻辑联系、意识与行动的联系等。我们在探寻知识从哪里来,知识如何导致行动的哲学问题后,总结了知识学习活动中的归纳原理,基于目标分析、抽取知识与合理结论的方法。

那么如何给出合理结论的形式化规则?什么又可以在形式化规则下被计算呢?

目前,在科学的飞跃发展中,重要基础领域涉及的数学形式化包含逻辑、计算和概率。

数学的思想可以追溯到古希腊文明时期,但是它的快速发展是从乔治·布尔(George Boole,1815—1864)完成命题逻辑也称为布尔逻辑开始的。接着,布尔逻辑被不断扩展,使它包含了对象和关系,此后又进一步将逻辑对象与现实世界对象联系起来。1900年,大卫·希尔伯特提出了一张问题清单,并成功预言这些问题能让数学家们忙碌近一个世纪。其中最后一个问题是:是否存在一个算法可以判定任何涉及自然数逻辑命题的真实性,这也是著名的可判定性问题(Entscheidungsproblem),或称为判定问题。

1930年,库特·哥德尔(Kurt Gödel,1906—1978)提出了存在一个有效过程可以证明一阶逻辑中任何真值语句,同时证明了确实存在真实的局限性。他提出的不完备性定理也证明了存在不可判定的真值语句,即问题的不可判定性。

与不可判定性一样困难的问题还包括不可计算性问题,因为有些问题或者有效过程的概念是无法给出形式化定义的。图灵通过图灵机的创造与实验证明,图灵机可以有能力解决任何可计算的问题,但是有一些函数是图灵机不可以计算的,例如没有图灵机可以判断一个给定的程序对于给定的输入是否能返回答案或者永远循环运行下去。

在计算问题的理解方面,不可判定性与不可计算性是其中两个很重要的方面,但是另外一个重要方面即不可操作性有更重要的影响。例如,如果一个问题需要的时间随实例的规模成指数级增长,那么这样的问题则称为是不可操作的。

另外,在逻辑和计算之外,概率思想是数学对 AI 的第三个重要贡献。因为它是对付不确定测量与不完备问题的有效手段。托马斯·贝叶斯(Thomas Bayes,1702—1761)提出了贝叶斯法则,后来拓展的贝叶斯分析方法成为了大多数 AI 系统中不确定推理的现代方法基础,如图1-6所示。

图1-6 贝叶斯分析方法及公式

3.心理学

随着智能概念研究的不断深入,人类智能与其他智能体的思维区别也被 AI 研究者广泛关注。例如,人类和动物是如何思考和行动的?

心理学的科学起源被认为是从德国人赫尔曼·赫姆霍兹(Hermann Helmholtz,1821—1894)在应用科学方法中运用物理学与生理学来研究人类的视觉开始的。1879年,赫姆霍兹的助手冯特(Wundt)在莱比锡大学开设了第一座实验心理学的实验室。实验中,实验者们在思考自己思维过程的同时要执行直觉的或者联想的任务。

在心理学的研究中,也分为只研究拒绝任何精神过程的行为主义流派与拥有大脑信息处理的认知心理学流派。在这两个流派的发展中,肯尼思·克雷克(Kenneth Craik,1943)给出了基于知识的智能体的三个关键步骤:(1)刺激必须翻译成内部表示信息传递;(2)认知过程对表示信息进行处理并转换成新的内部表示信息;(3)表示信息最后都会被翻译回到行动上。

现在,心理学家的普遍观点是“认知理论就应该像计算机程序”那样描述详细的信息处理机制进而实现某种认知功能。这个观点也促使了 AI 在发展过程中融合了大量人类认知的信息处理机制,从而使得AI具备更多心理特征。

4.计算机工程

人工智能发展的最终成功必然是智能与智能载体的完美结合。通常,人工智能的智能载体被人类创造为人工制品,计算机就是目前最具代表性的人工制品智能载体。但接下来的问题是,我们如何才能创造出越来越能干的计算机?

现代数字电子计算机的发展是以 1940 年阿兰·图灵发明的第一台可运转的电动机械式计算机为标志的,如图1-7所示。其唯一目的是:解密破译德国密码机所发出的消息。从那时起,到21世纪初,每一代计算机的性能都几乎能在18个月翻一番,这在过去被称为“摩尔定律”。

图1-7 阿兰·图灵与第一台电动机械式计算机

由于目前计算机所带来的强大计算能力,AI的开发与应用得以快速发展。

5.控制论

智能计算机或人工智能制品在拥有各种类人的智慧功能后,人们还希望它能脱离人类的控制依赖,自动或独立自主运转。可是机器怎样才能在自己的控制下自动运转呢?

由于环境在时刻发生变化,机器需要人类不停地调整操作、监督来改变机器与环境的适应性。最初控制论的产生也是为了解决只有活的东西才能修改自身的行为来适应环境的变化这一问题。

第一台实现自我控制的机器诞生于公元前250年,亚历山大的凯西比奥建造了一架带有一个调整器的水钟以保持水流以恒定且能够预测的速度来通过。接下来,瓦特发明蒸汽机,并创造了蒸汽机中的节速器,从此机器自我控制来到了快速发展时期。在这个时期,稳定的反馈系统数学理论得到了快速发展。

创造现代控制论的主要人物是诺伯特·维纳(Norbert Wiener,1894—1964)。最初,他和同事为了研究心理学,用控制系统作为心理学模型,观察有目的的行为,试图利用调节机构使“状态误差”最小化。在此之后,维纳产生了对生物与控制系统之间认知联系的兴趣。后来又同电子计算机创始人冯·诺依曼一起探索数学和计算的认知模型,影响广泛。最后,他的著作《控制论》(Cybernetics,1948)还成为了畅销书,激发了人们对可控制机器创造的热情。

现代控制论能够设计令目标函数随时间变化最大化的系统,部分符合了 AI 人工制品的要求。但 AI 和控制论却归属两个不同领域,原因在于控制论的工具多为精确分析,处理对象也多为典型情况下的线性系统。而AI逻辑推理与计算工具可以让AI研究者处理人类复杂语言、感官视觉、事件规划这类问题,从而摆脱控制理论所用的数学方法的局限性。

1.2.2 人工智能的历史

要想了解人工智能向何处去,首先要知道人工智能从何处来。人工智能被公认为是在1956年的夏天诞生的,这源于麦卡锡与明斯基、申农、罗切斯特等一些科学家的聚会研讨。虽然很多科学家认为“计算理性”更能直观地表现这个新领域的研究内容,但由于这次研讨,为这个领域起的新名字——人工智能(AI)变得根深蒂固了。而且AI既独立于控制论、运筹学、决策理论,又不是数学的一个分支。原因就在于 AI 诞生的目的是复制人类的创造性、自我修养和语言功能,在当时没有任何一个领域能完全涉及这些问题。在这个目标指引下,AI发展的历史从目的思想的产生到巨大的期望热情,再到面临巨大的困难,再到发展出众多工业应用,再到 AI 现在成为了科学,时间虽然不像过去数千年人类智慧的发掘那么悠久,但知识的爆炸足够撬动人们对新的未知领域创造出更多成果,人们也对 AI的开发有了越来越清晰的认识。

通常,人工智能到目前为止的发展历程可以被划分为如下6个阶段:

发展起步时期:1956年—20世纪60年代初。人工智能概念提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个高潮。

发展反思时期:20世纪60年代—70年代初。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标的落空(例如,无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等),使人工智能的发展走入低谷。

发展应用时期:20世纪70年代初—80年代中。20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。

发展低迷时期:20世纪80年代中—90年代中。随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。

发展稳步时期:20世纪90年代中—2010年。由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年,国际商业机器公司(简称IBM)的深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,2008年IBM提出“智慧地球”的概念,这些都是这一时期的标志性事件。

发展蓬勃时期:2011年至今。随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长的新高潮。

伴随着人工智能技术的发展,人工智能产业也经历了诞生阶段、产业化阶段、爆发阶段这三个阶段,如图1-8所示。

图1-8 人工智能产业发展历程

1.2.3 人工智能的研究现状

随着人工智能迎来发展蓬勃时期,人工智能被认为是继蒸汽动力机械技术、电力技术与大规模生产、计算机及信息技术革命之后的第四次科技革命核心驱动力。人工智能在目前已经被公认为全新的生产力增长点,对生产结构和生产关系正在产生颠覆性的改变和影响。

人工智能研究目前被分为三大类别:符号主义学派、连接主义学派和行为主义学派,如图1-9所示。这些学派跟随着人工智能发展的不同时期也经历着起伏兴衰,它们在争论中完善理论,各自都做出了本学派的重大发现与贡献,但也一直没有哪一个学派或理论能够统一人工智能方面的学术研究。直到今天,这些学术研究依然是人工智能学术发展的最前端,而且它们也在不断深度融合、共同发展。

图1-9 人工智能三大学派核心及大数据技术融合

当前,人工智能领域的三个主要研究方向是机器视觉、语音识别和自然语言处理,分别对应于人类的视觉、听觉和语言能力。为了达到强人工智能水平,这些能力是必须的。得益于卷积深度神经网络,机器视觉在近年来已经取得了长足发展,在物体识别准确率和人脸识别准确率上已经达到或者超过了人类水平(如图1-10所示)。人工智能在语音识别方面也已经比肩人类水平,识别效率近年来快速上升。人工智能在自然语言领域也取得了很大进步,在一些具体任务上成效也非常显著。

图1-10 人工智能机器视觉系统示意图

当前,机器视觉的主要研究成就集中在对于具体物体的识别任务中,未来机器需要具备视觉场景理解能力,即不仅能够准确地识别物体,还能够结合人类知识分析具体场景。该任务相比于简单物体的识别要困难很多,机器要能够具备通用的理解能力,挖掘视频图像中的主要内容。实现这个目标,从而创造人类水平的视觉能力,一直是机器视觉研究人员的终极理想。语音识别领域的未来发展方向则体现在复杂场景下的识别效率,并有效结合其他信息。解决自然语言处理问题是人工智能最重要的几个方向之一。人类语言被认为是人类发展中非常关键的因素,正是因为能够通过语言交流快速传播知识,人类才能够从物竞天择中脱颖而出。然而,语言本身非常复杂,蕴含了大量的逻辑、推理,目前的学习系统并不能够很好地解决这些问题。通过未来几年的发展,自然语言处理领域将可能取得很大的进展,会逐渐揭开语言理解的奥秘,使得机器具备通用语言理解和逻辑推理能力。

虽然,目前人工智能在视觉、语音还有自然语言处理能力上已经得到了较大提升,但是仍具有很大的发展和提升空间。在未来发展中,这三个主要领域的研究工作还会长期持续,并取得更加重大的研究成果。

人工智能的另外一个发展方向是从少量标记数据中理解世界。目前,人工智能特别是深度学习,需要大量的标记数据才能训练,而且数据越多效果越好。但是,人类并不需要大量的示教就能理解世界,我们能够在没有大量标记数据的时候便形成良好的认识。比如,人们新见到一种植物的时候,就能马上对这种植物构建出一种识别模式,而不需要反复观察。目前的学习系统不具备这方面的能力,无法通过少量的样本得出一种简单的模式。所有这些系统目前都使用有监督的学习,在这个过程中,机器是通过人类标记的输入进行训练的。未来几年的挑战是让机器从原始的、未标记的数据(如视频或文本)中学习,这就是所谓的无监督学习。人工智能系统目前不拥有“常识”。人和动物通过观察世界,在其中行动,并且了解它的物理机制。部分专家认为无监督学习是通向具有常识的机器的关键。为此,必须重新定义无监督学习的方法,比如通过对抗学习重新定义目标函数。

另外,人工智能目前采用的研究方法包含深度学习、深度强化学习、进化/群智计算、半/非监督训练、对抗式生成网络等。同时,在应用领域包含复杂优化与仿真、语音/图像识别、自然语言处理、机器人技术、机器博弈、动态控制技术、大数据分析等。在研究方法发展过程中,一些具有里程碑意义的成果包括ImageNet大规模物体检测、人脸识别、自动驾驶、计算机围棋程序(AlphaGo)、神经机器翻译、机器作画、聊天机器人、智慧医疗与教育、智能游戏等,如图1-11所示。

图1-11 人工智能发展成果

未来的五到十年将是人工智能技术的飞速发展时期。在学术方面,有关基础理论的研究将更加深入和细化,应用上将向不同的领域渗透,呈现出更加迅猛的发展势头。人工智能会快速取代某些传统的依赖手工作业的工作,促进产业快速升级换代,产生新型人工智能相关行业。未来,人工智能技术的发展会将人类社会发展推到一个前所未有的新高度,我国也将进入智能时代。