
作者:老范
2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;
2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。从此围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平。阿尔法围棋只是机器人家族中的一员,还有IBM的沃森机器人、百度的阿波罗以及工业领域的智能机器人等,这些新物种都属于一个学科叫做人工智能。

人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。人工智能涉及到计算机科学、心理学、神经科学、哲学和语言学等几乎是自然科学和社会科学的所有学科,是一个多学科融合的集合学科。
人工智能是人的智力和机器的机械力的完美融合。人工智能是如何让机器具备智能的呢?如何控制机器人按照人的意志去达成目标呢?在这个学科的背后,有一个底层学科叫控制论,控制论的理念和方法,帮助我们更好的对工具和机器进行控制,以实现人类的目的。
一、控制论基础
1、什么是控制论
控制论是研究动物、机器、自然和社会等系统中控制、反馈和通信的共同规律的科学。是研究如何利用控制器,通过信息的变换和反馈作用,使系统能自动按照人们预定的程序运行,最终达到最优目标的学问。它是自动控制、通讯技术、计算机科学、数理逻辑、神经生理学、统计力学、行为科学等多种科学技术相互渗透形成的一门横断性学科。

在1948年,美国数学家、物理学家、生物学家、哲学家诺伯特·维纳在《控制论——关于在动物和机器中控制和通讯的科学》一书中,提出了著名的控制论,标志着控制论的诞生。
诺伯特·维纳,从小就智力超常,三岁时就能读会写,十四岁时就大学毕业,18岁就获得了美国哈佛大学的博士。
控制论的思想和方法一经提出,便快速的渗透到了几乎所有的自然科学和社会科学领域。

2、可能性空间
一切科学研究都必须有一个出发点。控制论的研究则开始于可能性空间。什么是可能性空间呢?可能性空间就是一个事物发展的过程中多种可能性组成的空间。世界上许多事物并不是从一开始就注定要发展成现在这个样子的,在事物发展的初期,它们往往有多种发展的可能性,由于条件或者偶然的因素,最终才沿着某一个特定的方向发展下去。
例如:大学生毕业后,我们可以选择各种各样的工作,也可以选择在不同的城市生活,这就是选择空间,选择是自由的,你的选择有几十种甚至上百种。
选择是需要智慧的,选择也需要运气,能不能做出正确的选择将会决定你的命运,人生就是无数个选择的集合,因为只要选择之后,你就会被锁定在这个路径上,很难重新选择,即使可以重新选择,也会付出高昂的时间成本和转换成本。所以选择是有成本的,在经济学上叫做机会成本。

任何事物,都有它一定的可能性空间,但这仅仅是可能性而已,至于事物具体发展成为可能性空间中哪一个状态,要看条件和运气而定。当事物变到某一状态后,它又面临着新的可能性空间。所以一个事物发展过程中的可能性空间就像树枝一样向无数个方向延伸出去。
在生物学上,科学家认为物种就是按照一个树的形状展开的,专业术语叫做“进化树”。每一个物种进化方向都没有目的性,进化过程充满着随机性和偶然性,物种能不能生存,取决于能不能适应环境,大自然一直在挥舞着它那把无情的剪刀,对那些不能适应新环境的物种,进行着无情的修理。

控制就是人们根据自己的目的,改变条件,使事物沿着可能性空间内某种确定的方向发展,就形成控制。一切控制过程,实际都是由三个基本环节构成的:
(1)了解事物面临的可能性空间是什么。如一个人得了传染病,他可能好转、恶化、死亡。
(2)在可能性空间中选择某一些状态为目标。如治病的目标是使病情好转。
(3)控制条件,使事物向既定的目标转化。如采用隔离、戴口罩、吃药来治疗疾病。
可能性空间是控制的基础,一切的控制方法都是为了缩小可能性空间,最终达成自己期望的目标。
3、控制算法
随机控制:随机控制一般用在对对象一无所知或所知甚少的情况下。因此随机控制有个特点,就是在随机控制过程中,系统的可能性空间只有在达到目标值时才缩小,不达到目标值时,可能性空间不会缩小。通俗讲就是碰运气。

例如:如果你想打开一把锁,你手上有10把钥匙,那么你可以随机的进行试验,如果运气好,可能试用1一2次就可以打开锁,如果运气不好,可能需要10次以上才能打开。
当人类对一个事物没有任何经验或者知识的时候,一般会采用随机控制方法。
例如:中国的中医就是经验的累积,在远古时代,人类没有办法对抗疾病,在选择药物的过程中,只能随机试验,这就是最早的“神农尝百草”。
随机控制的缺点是如果碰得不巧,要花费很长时间才能碰上目标。
记忆控制:在随机控制的基础上加一个记忆装置,使随机控制成为有记忆的选择。也就是我们通常讲的“不要在同一个地方摔倒”。对容易摔倒的地方进行标注。与无记忆的控制比较,有记忆控制的可能性空间在到达目标值之前是随着选择次数逐一缩小的。这样就提高了控制的效率,可以较迅速地找到目标。

例如,你手上有10把钥匙,你可以每试验一个,就在这把钥匙上做个标记,这样,你就可以很快找到开锁的钥匙,以避免一把错误的钥匙试验好几次。
共轭控制:共轭的本意是两头牛背上的架子称为轭,轭使两头牛同步行走。共轭即为按一定的规律相配的一对。以古代曹冲称象为例,想直接称大象质量做不到,那就首先将大象转化成同质量的石头,之后称量许多小石头的质量,最后将石头质量转换为大象质量,这就是共轭控制过程。现代社会采用的计算机模拟,计算机建模等,很多都是采用共轭控制法。
二、控制论方法
无论是自动机器,还是神经系统、生命系统,以至经济系统、社会系统,都是一个控制系统。控制的基础是信息,一切信息传递都是为了控制,控制就是通过信息的传输、变换、加工、处理来实现的。香农的信息论是控制论的一个基础学科,在控制论中得到广泛应用。
控制论的采用主要方法有反馈方法、功能模拟方法和黑箱方法等。

1、反馈方法
反馈是指将系统的输出返回到输入端并以某种方式改变输入,进而影响系统功能的过程。反馈对系统的控制和稳定起着决定性的作用,无论是生物体保持自身的动态平稳,或是机器自动保持自身功能的稳定,都是通过反馈机制实现的。
反馈分为正反馈和负反馈。 正反馈是反馈信息与原信息起相同的作用,使总输入增大。系统目标差增大,加剧系统不稳定,多次的正反馈就会形成恶性循环。
例如:小孩子不愿意学习,家长采用批评的方法,小孩子反而更加不爱学习。于是家长开始动手打孩子,最终形成恶性循环。正反馈就是你的输入不断放大你的目标差,而不是减少目标差。
而负反馈就是反馈信息与原信息起相反的作用,目标差不断减少,系统稳定,进而形成良性循环。 所以负反馈是控制论的核心。
例如:我们向月球发射一颗月球探测器,火箭在要飞越38万公里,有许多干扰根本无法事先估计到。发射前把轨道算得再精确,把发射方向控制得再准也不行。这里就需要用到负反馈,在月球探测器上安装多个探测器、传感器和修正装置,在飞向月球的过程中,不断的调整自己的方向,最终到达月球,这就是一种负反馈。

这种负反馈的方法,在大自然中非常普遍,例如老鹰的捕食过程就是一个负反馈。老鹰在1千米的高空,发现草原上有一只兔子,兔子时刻在运动,并且方向和速度具备不确定性,老鹰也不可能事先计算自己和目标的运动方程。鹰不是按照事先计算好的路线飞行的。鹰发现兔子后,马上用眼睛估计一下它和兔子的大致距离和相对位置,然后选择一个大致的方向向兔子飞去。在这个过程中它的眼睛一直盯着兔子,不断向大脑报告自己的位置跟兔子之间差距。不管兔子怎么跑,大脑作出的决定都是为了缩小自己跟兔子的差距。
这种决定通过翅膀来执行,随时改变着鹰的飞行方向和速度,调整鹰的位置,使差距越来越小,直到这个差距为零时,鹰就抓住兔子了。
我们来仔细分析一下这个过程。实际上这个控制系统主要由眼睛、大脑和翅膀三部分组成。

老鹰跟兔子位置的差距,通常称为目标差,眼睛主要是接收这种目标差信息,并把它传递到大脑。大脑指挥着翅膀改变鹰的位置,使鹰向目标差减小的方向运动,这个控制重复进行,就构成了鹰抓兔子的连续动作。
这里最关键的一点是大脑的决定始终使鹰的位置向减小目标差的方向改变,控制论中把这类控制过程称为负反馈调节。负反馈调节的本质在于设计了一个目标差不断减少的过程,通过系统不断把自己控制后果与目标作比较,使得目标差在一次一次控制中慢慢减少,最后达到控制的目的。因此,作为一般的负反馈调节机制必定要有两个环节:
(1)系统一旦出现目标差,便自动出现减少目标差的反应。
(2)减少目标差的调节要一次一次地发挥作用,使得对目标的逼近能积累起来。

这两个条件如果不完全满足,就不能算完善的负反馈调节。比如一般输电线路中的保险装置,如果电流值增大到某个限度,偏离控制目标,保险丝熔断,使供电中断。这些都是出现目标差时系统减少目标差的调节机制。但它们都不是完全的负反馈调节,因为它不满足第二个条件,目标差的减少不能通过一次一次调节积累起来。这一类半反馈调节在控制中广泛应用,但它们都不如负反馈调节来得完备和精确。
鹰所使用的这套抓兔子的办法现在被人们用来控制导弹*飞机打**。工程师们给导弹安上了眼睛—红外线装置,配上大脑—电子计算机,同时给它一付可以调节的翅膀——姿态调整装置。这样导弹就可以向着不断减少目标差的方向运动,直到把飞机击落。当然,把火箭发射到月球上去也采用了这样的办法。
显然,负反馈控制之所以应用如此广泛,如此有效,就是因为它可以把某种有限的控制能力累积起来,扩大了控制能力。每一次反馈,都在缩小可能性空间,直到达成目标。

2、黑箱方法
在控制理论中,一个未知的研究对象通常被称为一个“黑箱”。所谓“黑箱”方法,简单地说,就是给一个未知的研究对象输入信号,然后观察其输出信号的变化,通过黑箱外部的输入输出数据进行分析研究,得出对其内部结构认识的方法,在控制理论中有一个专门的术语叫做“系统辨识”。例如,如果将人看作是一个“知人知面不知心”的黑箱,人们可以通过“听其言,观其行”而“知其心”。来判断好人还是坏人,这种行为分析方法是一种典型的“黑箱”方法的应用。

控制论认为,认识黑箱有两种不同的方法。一种是不打开黑箱,一种是打开黑箱。不打开黑箱的方法就是不影响原有黑箱结构,通过黑箱外部的输入输出变量的研究得出关于黑箱内部情况的推理,探求黑箱的内部结构。而打开黑箱的方法就是要通过合适的手段在不影响黑箱原有结构和功能的情况下,观察和研究黑箱。
黑箱打开还是不打开,取决于人类的“开箱技术”和黑箱的复杂程度,例如地球这个黑箱就很难打开,只能通过观察外部的现象来认识地球内部结构。不管是打开还是不打开,黑想法都是人类认识自然的不同环节,都是不可缺少的。科学的方法就是不断认识黑箱的过程。
一般说来,科学方法有两种,一种是以培根为代表的“观察—归纳—证实”法,一种是以波普尔为代表的“问题—猜想—反驳”法,不打开黑箱和打开黑箱就是两种科学方法的组合应用。人们对观察的数据进行建立模型,提出假设,然后不断的证实和证伪,推动着理论的发展,解释着客观的世界。

人类认识大自然就是采用的这种黑箱法,例如人类的大脑就是一个黑箱,最早的心理学家是通过观察人的行为,认识脑的功能,提出了各种假设和解释。而随着医疗科技的发展,人类可以借助“裂脑实验”打开人的大脑,去观察和证实人的行为。当我们打开一个黑箱的时候,紧接着会有另一个黑箱,科学就是这样,理论和假设不断的被*翻推**,不断的被拓展,直到发现事物的本质和真相。
系统辨识是在输入、输出的基础上,从一类系统中确定一个与所测系统等价的系统。 通过考察系统的输入与输出关系认识系统功能的研究方法。是探索复杂大系统的重要工具。
系统辨识主要步骤是:实验设计、选择模型、参数估计和检验模型。

3、功能模拟法
人类在认识世界的过程中,太大、太小、太复杂的事物我们不便于观察,例如星系、细胞、人体的神经网络等,超出了人类肉眼能够观察的范畴。功能模拟法就是用功能模型来模仿客体原型的功能和行为的方法。所谓功能模型就是只以功能行为相似为基础而建立的模型。如老鹰抓兔子的过程与导弹系统的功能行为是相似的,但二者的内部结构和物理过程是截然不同的,这就是一种功能模拟。功能模拟法为仿生学、人工智能等提供了科学方法。
功能模拟方法的特点:
特点1:不是直接研究系统本身,而是通过建立模仿真实系统的模型进行实验来间接地研究真实系统。
特点2:不是对真实系统的外形、结构等加以模仿,而是对真实系统的功能或行为加以模仿,在行为功能上建立原型和模型的相似关系,而不论其具体的物质构造和形态。

功能模拟系统称为模型,模型大体上可可以分为两类,一类是实体模型,一类是形象和符号模型,也叫做理想模型。建立一个模型必须满足三个条件:即相似性、代表性和外推性。
(1)相似性,指模型与原型之间具有相似的关系;
(2)代表性,指模型在具体的研究过程中要能代替原型;
(3)外推性,指通过对模型的研究,能够得到关于原型的信息。
三、控制论应用
控制论横跨技术、生物、社会和思维等领域,运用统一的科学语言、概念和方法处理这些领域中的问题。通过对自然科学和社会科学的渗透,已经形成了新的学科,例如工程控制论、生物控制论、社会经济控制论和智能控制论等。

1、工程控制论
工程控制论是以工程控制为研究对象,研究的问题包括过程工业控制、机械加工自动化、电力系统自动化、飞行器控制、车辆与交通控制、工业大系统优化、综合自动化、网络化控制系统等。钱学森院士在1954年在美国发表的专著《工程控制论》是工程控制论的奠基之作,钱学森也成为了工程控制论的奠基人。
随着时间的发展,工程控制论包含的内容不断丰富,基本内容包括,线性系统理论、非线性系统理论、概率和统计方法的应用、最优控制理论、自适应自学习以及自组织系统的理论、系统辨识理论、大系统理论、模糊性理论等。
工程控制论的发展经历了三个阶段。

工程控制论的发展相对比较成熟,学科发展比较完备,特别是美国、欧洲、日本等发达国家在工业自动化领域比较领先,中国随着改革开发,在工程控制领域也取得的非凡的成就。
2、生物控制论
维纳最初提出的控制论就包括了两大部分,其一为工程控制论,其二为生物控制论。
一个是工程系统,一个是生命系统。生物系统远比工程系统更为复杂,一个细胞的复杂程度远远高于一个宇宙飞船。生物系统是经过漫长进化、优胜劣汰的产物。所有生物体都是一个多层次结构的复杂系统,由细胞组成不同的组织,由组织构成不同的器官,与组织组成各种功能系统,各功能系统在神经系统的协调与控制下,完成整个生命活动过程。在细胞、组织、器官、系统、个体等层次上都存在信息处理与调节控制。
信息处理与控制过程非常巧妙,也非常复杂。所以研究生物控制论目的是为了揭示生命的奥妙,为疾病诊断与治疗、生态环境保护与控制提供帮助。

生物系统是一个极为复杂的、性能完善的多级结构的大系统,生物细胞的分形和自组织对控制能力的要求极高,生物控制论的核心就是研究研究生物系统中信息处理及控制机制,主要包括生物反馈系统分析与神经控制论两大部分。
生物体中存在大量的反馈系统,如呼吸系统、血液循环系统、体温调节系统等,生物反馈系统的任务就是通过建立系统的数学模型,以计算机仿真及实验的方法研究整个系统的动态特性,进而了解其运行原理,为生命健康保驾护航。
生物体是复杂的统一体,神经系统是一个非常完美的信息处理系统,各器官组织在神经系统的协调与控制下完成各种生命活动。神经控制论主要就是研究神经系统的信息处理问题,包括神经元与神经网络模型的研究、感觉信息处理的研究、大脑理论的研究等。

3、社会经济控制论
控制论创始人维纳在20世纪60年代就肯定控制论能应用于社会与经济。社会控制比工程控制要复杂得多。人类社会可被看作是高度复杂的政治经济文化与生态环境的复杂巨系统,是由无数个智能个体构成的自组织系统,涉及社会学、国家管理、行政管理、法律、经济学、人口学、企业管理、生态学、环境学等。这种结构复杂、规模宏大、具有多种不确定因素的系统涉及的问题非常复杂,并且相互交织,相互影响。所以,要完整地解决社会控制中的所有问题还需要管理阶层、决策阶层、控制科学家以及其他有关领域的专家共同长期的努力。
目前,社会控制中相对成熟的是人口控制、社会经济控制、医疗和保障系统、治安和防止犯罪系统等。例如中国在人口管控上面,运用了很多策略,采用计划生育对总人口的增长进行限制,采用户籍制度调控农村和城市的人口流动,采用严格的入籍政策对非法移民进行限制。

中国对社会经济的控制也非常有力,从经济刺激、金融管控、税务稽查都建立了完善的管理制度。在治安和防止犯罪系统方面,建立了天网和人脸识别系统,大大降低了犯罪率,成为全世界最安全的国家之一。在医疗保障系统方面,中国积极推进全民医疗,为居民的身体健康提供了保障。系统越复杂,就会越脆弱,智能个体微小的波动,都有可能引发多系统之间的连环故障,造成巨大的损失。
例如:刚刚中国发生的新型冠状肺炎传染病,对中国的医疗系统、社会管理系统、人口管控系统、交通运输系统、经济系统等多个方面都产生巨大的冲击。也在不断的考验着各个部门的管理控制能力和协调能力。
国民经济系统是一个复杂适应性系统,涉及到各行各业、全球经济形势、以及决策层制定的经济政策,要想管理好经济系统,管理层需要搜集客观真实的经济数据,对经济进行数学建模,做出精准预测,才能保证经济健康而又平稳运行。

企业管理也是一个复杂系统,管理者需要对市场形势进行研判,搜集销售数据,建立管理模型,做出市场预测,以保证企业的竞争力。

4、智能控制
随着认知神经科学和计算机技术的快速发展,出现了以人工智能为代表的智能科学。智能科学的出现将改变整个科学的内部结构和研究风格,为新的工业革命奠定理论基础。目前,信息处理的问题日益突出,人类智力的局限性日益暴露。而新的工业革命的目的是要突破人类智力的局限性,为高效能信息处理系统的建立和使用寻求理论基础。这场革命的核心问题是智能,其理论成果就是智能科学。
钱学森在1981年初提出了相当于智能科学的思维科学的概念。他提出逻辑学、形象思维学、灵感学是思维科学的基础学科。语言学、文字学、密码学、人工智能、计算机软件技术、图象识别技术等,是思维科学体系中的应用技术。

把控制论的理论和方法,尤其是人工智能的理论和方法应用于工程系统,便产生了包括机器人在内的诸多智能系统。机器人是当代最高意义上的自动化,机器人是一个多学科和技术交叉相结合的综合高技术领域。
从某种意义上讲,一个国家机器人技术水平的高低反映了这个国家综合技术实力的高低。因为一个机器人包含的内容极其丰富,如语音识别系统及其衍生的计算机语音输入等、文字识别系统及其衍生的机器自动翻译等、机器视觉与目标识别、智能检测与目标自动跟踪等。
人工智能的核心是问题求解。问题求解的基本方法就是推理法和试探法,更多的情况下这两种方法是综合使用的。用计算机自动求解智能问题可以归结为三步:
第一步是形式化:把实际问题的描述形式化(即符号化)。形式化是思维过程机械化和自动化的前提,是研究人工智能的必要条件。

算法必须满足这样三个条件
确定性(其中的任何状态和步骤必须是精确的、唯一的);
普遍性(算法应能用于解决一整类问题,而不是只能解决某个具体问题);
有效性(对该类中的任何问题,经有限步运算之后,一定可以导致所求的结果)。
只有掌握了一类问题的全部信息以后,才有可能总结出算法来。因此算法也叫全信息算子。算法是一个纯数学问题,数学就是研究算法的,数学是把一个具有千丝万缕联系的实际问题转化成-一个全信息的具有明确结构的有限状态空间问题。
第三步是自动化:对计算机来说,就是用某种方便的计算机语言把这些算法写成程序,交给机器去自己执行。
总结
长期以来,在科学史与哲学史上,一直存在着目的论与机械论的严重对立。目的论是一种唯心主义哲学学说。它认为自然界的一切事物都有其存在的目的。神学唯心主义把上帝说成是宇宙万物的最高指导,认为世界是上帝创造的,万物是由上帝安排的,因此自然界的一切都是合乎目的的。
以牛顿为代表的机械论不承认目的论。他认为世界万物的运动都是机械运动。机械运动是唯一的因果关系。机械论否定机器与动物以及与人的区别,认为生命完全是物质的,生命就是一架复杂的机器。控制论的出现终结了目的论和机械论之争,从一个新的视角统一了目的与因果关系。控制论以信息论和系统论为基础,从昔日科学家对物质和能量的研究一跃成为信息和系统的控制和通讯研究,打通了自然科学、生命科学、工程科学、数学和社会科学之间鸿沟,为人类认识和改造世界提供了新的理论支撑。
参考资料:
《控制论》第二版
作者:N.维纳
郝季仁 译
科学出版社
《控制论:概念、方法与应用》 第2版
作者:万百五,韩崇昭,蔡远利
清华大学出版社
《控制论与科学方*论法**》
作者:金国涛、华国凡
新星出版社
《控制论、信息论、系统科学与哲学》第二版
作者:王雨田
中国人民大学出版社
自动控制理论课程设计探索
孟令雅
中国石油大学(华东)信息与控制工程学院