博文

机器认识论：基于数学统一性的通用人工智能

已有 3777 次阅读 2019-8-12 11:02 |系统分类:论文交流

通用人工智能是当前AI研究的主流，它有计算机科学和神经科学这两种导向。本文讨论了以数学基础为导向的第三种研究方法，其核心思想是区分不同的数学范式，机器内部可以实现不同数学范式的相互映射和相互转换，这是机器实现自我学习、自主认识、自动编程之关键。通用学习机是实现通用人工智能的基石，机器认识论本质上是一种现代性的毕达哥拉斯主义和康德先验哲学。

一、开发通用人工智能的三种导向

通用人工智能（AGI）是人工智能（AI）研究的终极目标，也是当前AI技术研发的最前沿领域。人们对AGI的一般定义是：一种可以模仿人类所有行为的AI，也就是说，机器可以执行人类所有能够完成的任务。AlphaGo的研发者戴密斯·哈萨比斯（Demis Hassabis）博士在剑桥大学演讲时承认，其团队的最终目标就是让AlphaGo能实现AGI^[1]。

目前，开发AGI的方法有两种。一种是以计算机科学为导向，强调通过机器编程来模拟人类的外部行为，而不去追究其内在驱动力究竟是什么，这就是符号主义或行为主义的研究方法。另一种就是以神经科学为导向，强调首先要搞清楚人类行为的内在驱动力是什么，然后再设计一种人工神经网络来实现这些神经心理学功能，让机器尽量精确地去模拟人脑，这就是联结主义或功能主义的研究方法。

然而，依靠编程和模拟人脑来实现AGI这两种方法，都面临着巨大的、甚至不可克服的困难。首先，由于受到摩尔定律的限制，计算机经过80多年的发展，人工编程这种传统方法已濒临极限，许多人类复杂的行为，不可能完全通过人工编程去让机器机械地模拟、执行，而是必须通过机器学习让它自己去适应和掌握。就像AlphaGo下围棋，它能发明一些人类从未发现过的围棋策略，其棋力远远超出了人类所达到的水平，这就说明了，机器学习要比传统的人工编程方法更具有开发潜力。机器学习已经成为当今计算机科学发展的主流。其次，目前神经科学对人脑的认识还处于非常浅显的阶段，离彻底搞清楚大脑具体的工作机制非常遥远，在可预见的很长时间内，脑科学很难取得根本性的突破，所以要让机器来精确地模拟人脑，这是不可能做到的事情。最近，耗费13亿欧元的“人类脑计划”（HBP）宣告失败，就说明了认识和模拟人脑的艰难程度。

基于上述原因，我们提出一种新的开发AGI的研究方法，就是以数学基础为导向，不再是单纯去模拟人类的行为模式和大脑机制，而是先要搞清楚人类认识与机器认识共同遵循的数学原理是什么，最后通过强有力的数学手段来实现AGI。钟义信教授提出的“机制主义AI”概念^[2]，跟我们的观点是接近的，他强调的是通过主客体之间的信息交换过程来建构AGI，而我们更多地是强调通过数学自身的抽象结构来建构AGI。人脑和电脑，其硬件和软件的形态完全不同，但它们遵循的数学原理却是形式同构的。所以，只要我们能搞清楚AGI抽象的数学结构，也就相当于建构起了AGI的数学模型，这跟搭建其算法（软件）构架和物理（硬件）构架是形式等价的。“万物皆数”，数学是宇宙的通用法则，计算主义就是一种现代性的毕达哥拉斯主义。

二、从通用计算机到通用学习机

无论计算机还是人工智能，追根溯源，都是从数学基础研究中发展起来的。1900年，希尔伯特在巴黎第二届世界数学家大会上提出了23个著名的数学问题，其中有3个是关于数学基础的，第一问题就是连续统假设CH，第二问题是关于数学的一致性和完备性，第十问题是关于数学的可计算性，即给定任何一个数学问题，判定它在有穷步骤内能否可解。

1936年，图灵在求解希尔伯特第十问题时，给出了“机械计算”的一种严格定义，这就是图灵机，它是通用计算机的数学模型。丘奇和哥德尔也给出过“机械计算”的不同定义，但跟图灵机是完全等价的，他们的定义都是从纯数理逻辑的意义上来考虑的，显得太复杂了，不像图灵机那样简洁优美地抓住了计算行为的直观本质，所以哥德尔对自己和丘奇的方法都不满意，唯独对图灵的方法口服心服，他认为“图灵机以一种精确定义完全把握了机械（或计算）过程的直观概念”。图灵机的横空出世，标志着计算机科学的诞生。因为，图灵机是通用计算机，它可以执行任何计算任务，现在我们使用的电脑，既可以解方程、作图，还可以听音乐、放视频，无论多么复杂的计算，都可以用一台图灵机来完成。这就是通用计算机的涵义。在图灵之前，人们早就发明了各种各样的计算装置，像中国古代的算盘，帕斯卡尔设计的“加法机”，巴贝奇（Charles Babbage）设计的“分析机”，以及IBM早期的机械电动计算机，等等，但这些计算装置都是专用计算机，只能执行某种特定的计算任务，不同的计算任务就需要设计不同的计算装置去执行，这显然不具备通用性和普及性。图灵机作为通用计算机的出现，才使得计算机普及化成为可能，这是20世纪人类进入计算机时代的标志。

人工智能的真正思想源头是哥德尔，1931年，他在求解希尔伯特第二问题时，证明了两个著名的不完备性定理，出人意料地指出了：在人们普遍使用的算术系统中存在着不可判定性的数学命题。在证明中，哥德尔首次使用了“程序内存”这个思想，它相当于是说：假设有一台机器能证明所有的数学公式，其计算程序也可以表示为一个数学公式，但这个程序公式却是不可判定的。哥德尔不完备性定理非常充分地表明：任何计算机都存在着极限，通用计算机无法实现自我编程。晚年哥德尔在跟王浩的谈话中，对图灵计算主义的观念提出了质疑，他认为并非所有的数学思维都是计算，心灵不是一台机器，主观数学在能力上超出所有的计算机，并特意指出：“我的不完全性定理大致表明，心灵不是机械性的，或者心灵不能理解它自己的机制。如果把我的结果与希尔伯特持有的、未被我的结果否定的理性主义态度合在一起，那么我们可以推出心灵不是机械性的这一明确的结果。所以如此，是因为假若心灵是台机器，则会存在人心不可判定的数论问题，而这与理性主义态度相悖。”^[3]

图灵对哥德尔不完备性定理也印象深刻，他敏感地意识到了通用计算机不能自我编程的局限性，并想法设法来弥补其缺陷。1938年，图灵在普林斯顿花了两年多的时间，写完了博士论文，他利用不断增长的超穷序数构造了一种逻辑系统，试图来解决不可判定性数学命题这个难题，但是他最终没能成功^[4]。一台机器要具有“智能”，那它就必须要能够自动修改程序，对不可判定的程序公式做出更好的处理，这个道理是显而易见的。如果机器只能按照设计好的固定程序执行任务，它的每一步都是确定的，输出的结果也是确定的，这样它当然就谈不上具有“智能”，特别是，它不能自己修改程序，因此也就无法具备学习能力。所以，要想使机器具有“智能”，它就必须突破哥德尔不完备性定理的限制，具备自动修改程序的能力，这样它才能通过不断学习来改进自己的计算方法，解决原来不可判定的数学问题。所以，计算机和学习机是两个概念，计算机不能自我编程，而学习机可以自我编程。

1950年，图灵发表了人工智能的开山之作《计算机器与智能》，表达了他对“机器能够思维吗？”这一终极问题的深思熟虑的哲学思考。这其实就是一个AGI问题，在图灵看来，只要计算机设计得足够强大，它就可以完成人类能做到的任何事情。但是，机器面对的外部世界是不断变化的，它要解决的任务也是无法确定的，所以，人们不可能把每一种要解决的任务，都事先给它设计好程序，所以，要想设计一台无所不能的计算机，把一切可能的程序都事先设计好，这其实是不可能做到的事情。人脑也不是事先就设计好了所有做事情的程序，而是通过不断积累经验，不断学习，逐渐掌握和完善各种做事情的能力。从这种意义上来说，人脑不是一台计算机，而是一台学习机。图灵也意识到这两种机器的本质差别，在文末，他专门写了“学习机”一节，指出它跟图灵机的主要差别在于两点：学习机的运算规则可以改变，并具有随机性和统计性的特征^[5]。他这一看法无疑是具有先见之明的。

2005年是一个历史转折点，基于神经网络的深度学习在工程上大获成功后，人们才做出来第一台真正意义上的学习机，人工智能也因此告别了将近30年的“寒冬”，再次大火起来。传统的人工编程方式也受到了挑战，机器学习时代悄然来临。现在人们利用深度学习去训练各种机器，让它们去逐渐适应和掌握各种专门的任务，即通过反向传播BP算法，机器可以不断修正神经元的联结权重，不断逼近局部最优地去提取特征值，直到找到一种最佳策略^[6]。深度学习在不断改变着机器内部的状态转移表，不断调整输入和输出之间的函数关系，因此它具有了某种自我编程的能力，这就是学习机的显著标志。

但深度学习只是一种专用学习机，它只能完成某项规定的特殊任务，不同的学习任务就需要设计不同的学习机去执行，因此，它也不具备通用性和普及性。现在还没有人提出一种通用学习机的基础描述理论和基础算法，这对AGI研究就是一个致命的弱点。就像清华大学张钹院士最近指出的，目前深度学习的技术潜力已触及天花板，很难再创造出奇迹了。历史总是惊人地相似，就像图灵提出通用计算机的数学模型，开辟了20世纪人类的计算机时代，我们只有提出通用学习机的数学模型，给出AGI新一代计算机工程构架体系，21世纪人类才能真正迈进人工智能时代。通用学习机就是AGI的“图灵机”。

三、机器认识如何可能？

那么，我们怎样才能做出通用学习机？这就需要搞清楚机器是如何来认识外部世界的。AGI是一个大目标，是要要模拟人类全部的行为能力，而机器认识论集中在模拟人类认识能力这一个小目标上。机器认识大致可分三个阶段：首先，是识别一个事物，即把这个事物和其他事物区分开来；其次，就是给不同事物进行分类，形成逻辑推理关系；最后，就是确定不同事物的类的函数关系，这一步就是计算，所谓计算，就是确定输入和输出之间的函数关系，而编程就是来求解这个函数。机器认识的这三大步骤，需要导入的数学方法或数学范式也是不一样的。

先来讲第一步，机器识别一个事物A，就是要把A和¬A区分开来。外界输入机器内部的是杂乱无序的电脉冲信号，相当于二维平面上打上一堆斑点，如下图所示（略），机器能从中识别出一只狼来吗？显然，要识别出这只狼，机器就必须具有连通性、连续性和整体性的几何分析能力。任何事物存在的空间形式都是连续性的，当机器识别出这个连续性的整体图式时，也就等于它识别出了这个事物——狼，同时也把这个事物的图式A跟不是这个事物的图式¬A（背景）区分开了。不仅视觉如此，其他认识模式也都是如此，任何认识模式都必须具有一种连续性的整体图式。这就是瑞典认知科学家彼得·格登福斯（Peter Gärdenfors）等人提出的大脑的“认知空间理论”，他们认为：海马体的位置细胞（place cells）和网格细胞（grid cells）不仅映射物理空间，还能映射概念空间^[7]。就像目前流行的嵌入式神经网络处理器（NPU），就是一种系统结构关系的拓扑构架体系，它比冯•诺意曼体系CPU的处理速度要快数百倍。概言之，人脑和电脑都必须具有空间分析能力，这是一种基本的认识模式，也是一种基本的数学范式，我们称之为“几何范式”，它所包含的数学分支有各种几何学、拓扑、图论等。几何化的本质就是连续性。

再来讲第二步，机器识别出不同的事物后，就要进一步给这些事物进行分类，形成概念，并确定好这些基本概念之间的逻辑关系，这就是一种逻辑分析能力。逻辑分析也是一种基本的认识模式和数学范式，我们称之为“逻辑范式”，它所包含的数学分支就是形式逻辑和数理逻辑的各种扩展系统，其中最重要的就是一阶谓词系统和布尔代数。这里，我们要特别指出的是哥德尔完备性定理，即一阶谓词系统是完备的。逻辑化的本质就是完备性。

最后一步，当机器确定好基本概念后，最好还要能确定这些概念之间的递归函数关系，也就是说，任何概念最终都要能表示成一个自然数的迭代函数，这样它就可以用于计算了。所谓计算，就是指构造一个自然数的迭代函数（即递归函数）。按照直觉主义数学家布劳威尔的说法，自然数概念源于“时间分隔”的直觉，这种“数学的基本直觉，不仅创造了数1和2，而且也创造了一切有限序数”^[8]。自然数是最基本的数学概念，它反映了事物存在的时间形式，由自然数函数形成的数学系统就是算术分析，这也是一种基本的认识模式和数学范式，我们称之为“算术范式”，它所包含的数学分支就是线性代数、微分、最优化理论等。这里，我们要特别指出的是哥德尔不完备性定理，即算术系统是不完备的。算术化的本质是不连续性（离散性）和不完备性，所以，它跟几何化和逻辑化的性质是完全不同的。

几何范式、算术范式和逻辑范式这三种认识模式的划分，跟康德先验哲学其实是一脉相承的，几何范式和算术范式就相当于空间和时间这两种先验形式，而逻辑范式就相当于12种先验范畴，康德认为，大脑就是依靠这些先验结构来整理经验素材，形成理性认识和知识，这是哲学史上的经典理论了。冯•诺意曼的看法也差不多，他认为任何复杂自动机都具有完全码和短码这两种指令形式，“神经系统是基于两种类型的通讯方式的。一种是不包含有算术形式体系的，一种是算术形式体系的。这就是说：一种是指令的通讯（逻辑的通讯），一种是数字的通讯（算术的通讯）。前者可以用语言叙述，而后者则是数学的叙述”，他强调人脑的语言不是数学的语言，“无论这个系统（注：指人脑）如何，把我们所自觉地、明确地认为是数学的东西，和这个系统适当地区分开来，这是不会错的。”^[9]如果把冯•诺意曼讲的“数学的语言”进一步再细分成几何语言与算术语言，那他的观点就跟康德先验哲学完全一致了。

所以，我们追问“机器认识如何可能”，就跟康德追问“形而上学如何可能”、“纯粹数学如何可能”、“纯粹自然科学如何可能”是一样的，人脑和电脑都是要通过一些先验结构或数学范式来认识外部世界的，所谓认识，就是指这些数学范式之间的相互映射和相互转换。从认识论的观点看，几何直觉、逻辑分析和算术计算（数字计算）是三种基本的认识能力，它们都形成了各自庞大而复杂的数学体系，现代数学最前沿、最有创造性的领域就在于几何、算术和逻辑之间的交叉地带，像代数几何、范畴论、朗兰兹纲领等，重点都是要探索不同数学范式或数学结构的相互映射和相互转换。如果说过去数学的终极目标是追求其严谨性，那么未来数学的终极目标则是追求其统一性。AGI的崛起正好为数学的统一性提供了最强大的实验室。我们要探索大脑的奥秘，实现AGI的终极目标，最关键的还是要在数学基础研究上取得重大突破，找到一种描述不同数学范式相互映射、相互转换的基本理论体系。数学的统一性无疑将成为未来数学发展的最前沿，这也将是新一代计算机和AGI研究的核心。

四、结论：计算、编程和学习

自计算机诞生起，就是以编程为主，但人工编程这条路已逐渐走不通了，机器学习成为当前AI技术研发的主流。因为，能够编程的任务还是相对比较简单的，许多复杂的任务是根本没法去编程的。那么，计算、编程和学习究竟是什么样的关系呢？

计算和编程都属于算术范式之内的工作，计算就是写出一个递归函数，而编程就是求解这个递归函数，很多情况下，我们能写出一个代数方程，但却根本解不出这个方程。因此，计算就相当于计算复杂性中的N类问题，而编程就相当于NP类问题，人们倾向于认为这两类问题是不等价的。可编程的问题只是可计算的问题一个很小的真子集。

如果问题不能编程，那么机器就没法处理这些问题，此时就需要通过机器学习来解决之。学习是一种通过数据和经验的积累，逐渐形成新概念和新知识的认识过程，其核心就是几何直觉和逻辑分析。计算机不能自我编程，因为其内部的先验结构都是算术范式，它是不连续和不完备的；而学习机能自我编程，因为其内部的先验结构还有几何范式和逻辑范式这两种，它们是连续性和完备性的。计算机和学习机的内部结构是根本不同的。

这就是我们提出机器认识论的主要观点，机器要能实现自我编程，它内部就必须具有一些不同于图灵机的数学结构，这些数学结构其实并不神秘，就是我们熟悉的几何结构和逻辑结构。图灵机是离散性和不完备性的算术结构，而学习机是连续性的几何结构和完备性的逻辑结构，我们称之为“哥德尔机”^[10]。我们还证明了一个重要的数学定理：只要有足够的数据输入，具有完备逻辑结构的机器就能自动编程^[11]。当然，这个定理也适用于具有连续几何结构的机器，它证明了通用学习机是存在的。

概言之，通用学习机的存在性是一个基本数学定理，它是机器学习的核心，也是AGI的基石，相当于计算机中的“丘奇-图灵论题”。有了这条基本数学定理，我们就可以来大胆地设想和设计具有认知能力的通用智能机器了。

参考文献：

[1]戴密斯·哈萨比斯，“超越人类认知的极限”,文章来源：https://www.sohu.com/a/134114430_640189。

[2]钟义信，“机制主义人工智能理论——一种通用的人工智能理论”[J]，《智能系统学报》，2018,13（1）：pp2-18。

[3] (美)王浩：《逻辑之旅：从哥德尔到哲学》，浙江大学出版社200年版，第六章。

[4]A. M.Turing(1938) ，“Systems of logic based on ordinals”, transcribed by Artificial Intelligence and Computer Science Laboratory, Universidade do Porto, Portugal, September 18, 2014.

[5]A.M.图灵，“计算机器与智能”，载于《人工智能哲学》，上海译文出版社2001年版，pp83-90。

[6]Rumelhart D,Hinton G,Williams R(1986):“Learning internal representations by error propagation”,in Parallel Distributed Processing,chapter 8.MIT Press,Cambridge,MA.

[7]Jacob Bellmund, Christian Doeller,Edvard Moser：“Navigating cognition: Spatial codes for human thinking”，http://science.sciencemag.org/content/362/6415/eaat6766。

[8]约•冯•诺意曼：《计算机与人脑》，商务印书馆1965年版，pp59-60。

[9]L.E.J.布劳威尔，“直觉主义和形式主义”，载于《数学哲学》，商务印书馆2003年版，p93。

[10]Chenjun Lv,Xiaohui Zou(2018): “How to Understand the Mathematical Basis of Two Basic Types of Computational Behavior”，https://link.springer.com/chapter/10.1007/978-981-13-7983-3_27?from=timeline&isappinstalled=0.

[11]Chuyu Xiong(2016)：“Discussion on Mechanical Learning and Learning Machine”, https://arxiv.org/pdf/1602.00198.pdf.

转载本文请联系原作者获取授权，同时请注明本文来自吕陈君科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3282433-1193331.html

上一篇：两种科普的概念：刍议新时代的科学精神
下一篇：AI发展史：从通用计算机到通用学习机

收藏 IP: 120.244.108.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

吕陈君

扫一扫，分享此博文

lvchenjun的个人博客分享 http://blog.sciencenet.cn/u/lvchenjun

博文

机器认识论：基于数学统一性的通用人工智能

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

吕陈君

全部作者的其他最新博文

全部精选博文导读

相关博文

lvchenjun的个人博客分享 http://blog.sciencenet.cn/u/lvchenjun

博文

机器认识论：基于数学统一性的通用人工智能

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

吕陈君

全部作者的其他最新博文

全部精选博文导读

相关博文

该博文允许注册用户评论请点击登录评论 (0 个评论)