lvchenjun的个人博客分享 http://blog.sciencenet.cn/u/lvchenjun

博文

机器认识论:基于数学统一性的通用人工智能

已有 3777 次阅读 2019-8-12 11:02 |系统分类:论文交流

通用人工智能是当前AI研究的主流,它有计算机科学和神经科学这两种导向。本文讨论了以数学基础为导向的第三种研究方法,其核心思想是区分不同的数学范式,机器内部可以实现不同数学范式的相互映射和相互转换,这是机器实现自我学习、自主认识、自动编程之关键。通用学习机是实现通用人工智能的基石,机器认识论本质上是一种现代性的毕达哥拉斯主义和康德先验哲学。

 

一、开发通用人工智能的三种导向


通用人工智能(AGI)是人工智能(AI)研究的终极目标,也是当前AI技术研发的最前沿领域。人们对AGI的一般定义是:一种可以模仿人类所有行为的AI,也就是说,机器可以执行人类所有能够完成的任务。AlphaGo的研发者戴密斯·哈萨比斯(Demis Hassabis)博士在剑桥大学演讲时承认,其团队的最终目标就是让AlphaGo能实现AGI[1]


目前,开发AGI的方法有两种。一种是以计算机科学为导向,强调通过机器编程来模拟人类的外部行为,而不去追究其内在驱动力究竟是什么,这就是符号主义或行为主义的研究方法。另一种就是以神经科学为导向,强调首先要搞清楚人类行为的内在驱动力是什么,然后再设计一种人工神经网络来实现这些神经心理学功能,让机器尽量精确地去模拟人脑,这就是联结主义或功能主义的研究方法。


然而,依靠编程和模拟人脑来实现AGI这两种方法,都面临着巨大的、甚至不可克服的困难。首先,由于受到摩尔定律的限制,计算机经过80多年的发展,人工编程这种传统方法已濒临极限,许多人类复杂的行为,不可能完全通过人工编程去让机器机械地模拟、执行,而是必须通过机器学习让它自己去适应和掌握。就像AlphaGo下围棋,它能发明一些人类从未发现过的围棋策略,其棋力远远超出了人类所达到的水平,这就说明了,机器学习要比传统的人工编程方法更具有开发潜力。机器学习已经成为当今计算机科学发展的主流。其次,目前神经科学对人脑的认识还处于非常浅显的阶段,离彻底搞清楚大脑具体的工作机制非常遥远,在可预见的很长时间内,脑科学很难取得根本性的突破,所以要让机器来精确地模拟人脑,这是不可能做到的事情。最近,耗费13亿欧元的“人类脑计划”(HBP)宣告失败,就说明了认识和模拟人脑的艰难程度。


基于上述原因,我们提出一种新的开发AGI的研究方法,就是以数学基础为导向,不再是单纯去模拟人类的行为模式和大脑机制,而是先要搞清楚人类认识与机器认识共同遵循的数学原理是什么,最后通过强有力的数学手段来实现AGI。钟义信教授提出的“机制主义AI”概念[2],跟我们的观点是接近的,他强调的是通过主客体之间的信息交换过程来建构AGI,而我们更多地是强调通过数学自身的抽象结构来建构AGI。人脑和电脑,其硬件和软件的形态完全不同,但它们遵循的数学原理却是形式同构的。所以,只要我们能搞清楚AGI抽象的数学结构,也就相当于建构起了AGI的数学模型,这跟搭建其算法(软件)构架和物理(硬件)构架是形式等价的。“万物皆数”,数学是宇宙的通用法则,计算主义就是一种现代性的毕达哥拉斯主义。

 

二、从通用计算机到通用学习机


无论计算机还是人工智能,追根溯源,都是从数学基础研究中发展起来的。1900年,希尔伯特在巴黎第二届世界数学家大会上提出了23个著名的数学问题,其中有3个是关于数学基础的,第一问题就是连续统假设CH,第二问题是关于数学的一致性和完备性,第十问题是关于数学的可计算性,即给定任何一个数学问题,判定它在有穷步骤内能否可解。


1936年,图灵在求解希尔伯特第十问题时,给出了“机械计算”的一种严格定义,这就是图灵机,它是通用计算机的数学模型。丘奇和哥德尔也给出过“机械计算”的不同定义,但跟图灵机是完全等价的,他们的定义都是从纯数理逻辑的意义上来考虑的,显得太复杂了,不像图灵机那样简洁优美地抓住了计算行为的直观本质,所以哥德尔对自己和丘奇的方法都不满意,唯独对图灵的方法口服心服,他认为“图灵机以一种精确定义完全把握了机械(或计算)过程的直观概念”。图灵机的横空出世,标志着计算机科学的诞生。因为,图灵机是通用计算机,它可以执行任何计算任务,现在我们使用的电脑,既可以解方程、作图,还可以听音乐、放视频,无论多么复杂的计算,都可以用一台图灵机来完成。这就是通用计算机的涵义。在图灵之前,人们早就发明了各种各样的计算装置,像中国古代的算盘,帕斯卡尔设计的“加法机”,巴贝奇(Charles Babbage)设计的“分析机”,以及IBM早期的机械电动计算机,等等,但这些计算装置都是专用计算机,只能执行某种特定的计算任务,不同的计算任务就需要设计不同的计算装置去执行,这显然不具备通用性和普及性。图灵机作为通用计算机的出现,才使得计算机普及化成为可能,这是20世纪人类进入计算机时代的标志。


人工智能的真正思想源头是哥德尔,1931年,他在求解希尔伯特第二问题时,证明了两个著名的不完备性定理,出人意料地指出了:在人们普遍使用的算术系统中存在着不可判定性的数学命题。在证明中,哥德尔首次使用了“程序内存”这个思想,它相当于是说:假设有一台机器能证明所有的数学公式,其计算程序也可以表示为一个数学公式,但这个程序公式却是不可判定的。哥德尔不完备性定理非常充分地表明:任何计算机都存在着极限,通用计算机无法实现自我编程。晚年哥德尔在跟王浩的谈话中,对图灵计算主义的观念提出了质疑,他认为并非所有的数学思维都是计算,心灵不是一台机器,主观数学在能力上超出所有的计算机,并特意指出:“我的不完全性定理大致表明,心灵不是机械性的,或者心灵不能理解它自己的机制。如果把我的结果与希尔伯特持有的、未被我的结果否定的理性主义态度合在一起,那么我们可以推出心灵不是机械性的这一明确的结果。所以如此,是因为假若心灵是台机器,则会存在人心不可判定的数论问题,而这与理性主义态度相悖。” [3]


图灵对哥德尔不完备性定理也印象深刻,他敏感地意识到了通用计算机不能自我编程的局限性,并想法设法来弥补其缺陷。1938年,图灵在普林斯顿花了两年多的时间,写完了博士论文,他利用不断增长的超穷序数构造了一种逻辑系统,试图来解决不可判定性数学命题这个难题,但是他最终没能成功[4]。一台机器要具有“智能”,那它就必须要能够自动修改程序,对不可判定的程序公式做出更好的处理,这个道理是显而易见的。如果机器只能按照设计好的固定程序执行任务,它的每一步都是确定的,输出的结果也是确定的,这样它当然就谈不上具有“智能”,特别是,它不能自己修改程序,因此也就无法具备学习能力。所以,要想使机器具有“智能”,它就必须突破哥德尔不完备性定理的限制,具备自动修改程序的能力,这样它才能通过不断学习来改进自己的计算方法,解决原来不可判定的数学问题。所以,计算机和学习机是两个概念,计算机不能自我编程,而学习机可以自我编程。


1950年,图灵发表了人工智能的开山之作《计算机器与智能》,表达了他对“机器能够思维吗?”这一终极问题的深思熟虑的哲学思考。这其实就是一个AGI问题,在图灵看来,只要计算机设计得足够强大,它就可以完成人类能做到的任何事情。但是,机器面对的外部世界是不断变化的,它要解决的任务也是无法确定的,所以,人们不可能把每一种要解决的任务,都事先给它设计好程序,所以,要想设计一台无所不能的计算机,把一切可能的程序都事先设计好,这其实是不可能做到的事情。人脑也不是事先就设计好了所有做事情的程序,而是通过不断积累经验,不断学习,逐渐掌握和完善各种做事情的能力。从这种意义上来说,人脑不是一台计算机,而是一台学习机。图灵也意识到这两种机器的本质差别,在文末,他专门写了“学习机”一节,指出它跟图灵机的主要差别在于两点:学习机的运算规则可以改变,并具有随机性和统计性的特征[5]。他这一看法无疑是具有先见之明的。


2005年是一个历史转折点,基于神经网络的深度学习在工程上大获成功后,人们才做出来第一台真正意义上的学习机,人工智能也因此告别了将近30年的“寒冬”,再次大火起来。传统的人工编程方式也受到了挑战,机器学习时代悄然来临。现在人们利用深度学习去训练各种机器,让它们去逐渐适应和掌握各种专门的任务,即通过反向传播BP算法,机器可以不断修正神经元的联结权重,不断逼近局部最优地去提取特征值,直到找到一种最佳策略[6]。深度学习在不断改变着机器内部的状态转移表,不断调整输入和输出之间的函数关系,因此它具有了某种自我编程的能力,这就是学习机的显著标志。


但深度学习只是一种专用学习机,它只能完成某项规定的特殊任务,不同的学习任务就需要设计不同的学习机去执行,因此,它也不具备通用性和普及性。现在还没有人提出一种通用学习机的基础描述理论和基础算法,这对AGI研究就是一个致命的弱点。就像清华大学张钹院士最近指出的,目前深度学习的技术潜力已触及天花板,很难再创造出奇迹了。历史总是惊人地相似,就像图灵提出通用计算机的数学模型,开辟了20世纪人类的计算机时代,我们只有提出通用学习机的数学模型,给出AGI新一代计算机工程构架体系,21世纪人类才能真正迈进人工智能时代。通用学习机就是AGI的“图灵机”。

 

三、机器认识如何可能?


那么,我们怎样才能做出通用学习机?这就需要搞清楚机器是如何来认识外部世界的。AGI是一个大目标,是要要模拟人类全部的行为能力,而机器认识论集中在模拟人类认识能力这一个小目标上。机器认识大致可分三个阶段:首先,是识别一个事物,即把这个事物和其他事物区分开来;其次,就是给不同事物进行分类,形成逻辑推理关系;最后,就是确定不同事物的类的函数关系,这一步就是计算,所谓计算,就是确定输入和输出之间的函数关系,而编程就是来求解这个函数。机器认识的这三大步骤,需要导入的数学方法或数学范式也是不一样的。


先来讲第一步,机器识别一个事物A,就是要把A和¬A区分开来。外界输入机器内部的是杂乱无序的电脉冲信号,相当于二维平面上打上一堆斑点,如下图所示(略),机器能从中识别出一只狼来吗?显然,要识别出这只狼,机器就必须具有连通性、连续性和整体性的几何分析能力。任何事物存在的空间形式都是连续性的,当机器识别出这个连续性的整体图式时,也就等于它识别出了这个事物——狼,同时也把这个事物的图式A跟不是这个事物的图式¬A(背景)区分开了。不仅视觉如此,其他认识模式也都是如此,任何认识模式都必须具有一种连续性的整体图式。这就是瑞典认知科学家彼得·格登福斯(Peter Gärdenfors)等人提出的大脑的“认知空间理论”,他们认为:海马体的位置细胞(place cells)和网格细胞(grid cells)不仅映射物理空间,还能映射概念空间[7]。就像目前流行的嵌入式神经网络处理器(NPU),就是一种系统结构关系的拓扑构架体系,它比冯•诺意曼体系CPU的处理速度要快数百倍。概言之,人脑和电脑都必须具有空间分析能力,这是一种基本的认识模式,也是一种基本的数学范式,我们称之为“几何范式”,它所包含的数学分支有各种几何学、拓扑、图论等。几何化的本质就是连续性。


再来讲第二步,机器识别出不同的事物后,就要进一步给这些事物进行分类,形成概念,并确定好这些基本概念之间的逻辑关系,这就是一种逻辑分析能力。逻辑分析也是一种基本的认识模式和数学范式,我们称之为“逻辑范式”,它所包含的数学分支就是形式逻辑和数理逻辑的各种扩展系统,其中最重要的就是一阶谓词系统和布尔代数。这里,我们要特别指出的是哥德尔完备性定理,即一阶谓词系统是完备的。逻辑化的本质就是完备性。


最后一步,当机器确定好基本概念后,最好还要能确定这些概念之间的递归函数关系,也就是说,任何概念最终都要能表示成一个自然数的迭代函数,这样它就可以用于计算了。所谓计算,就是指构造一个自然数的迭代函数(即递归函数)。按照直觉主义数学家布劳威尔的说法,自然数概念源于“时间分隔”的直觉,这种“数学的基本直觉,不仅创造了数1和2,而且也创造了一切有限序数” [8]。自然数是最基本的数学概念,它反映了事物存在的时间形式,由自然数函数形成的数学系统就是算术分析,这也是一种基本的认识模式和数学范式,我们称之为“算术范式”,它所包含的数学分支就是线性代数、微分、最优化理论等。这里,我们要特别指出的是哥德尔不完备性定理,即算术系统是不完备的。算术化的本质是不连续性(离散性)和不完备性,所以,它跟几何化和逻辑化的性质是完全不同的。


几何范式、算术范式和逻辑范式这三种认识模式的划分,跟康德先验哲学其实是一脉相承的,几何范式和算术范式就相当于空间和时间这两种先验形式,而逻辑范式就相当于12种先验范畴,康德认为,大脑就是依靠这些先验结构来整理经验素材,形成理性认识和知识,这是哲学史上的经典理论了。冯诺意曼的看法也差不多,他认为任何复杂自动机都具有完全码和短码这两种指令形式,“神经系统是基于两种类型的通讯方式的。一种是不包含有算术形式体系的,一种是算术形式体系的。这就是说:一种是指令的通讯(逻辑的通讯),一种是数字的通讯(算术的通讯)。前者可以用语言叙述,而后者则是数学的叙述”,他强调人脑的语言不是数学的语言,“无论这个系统(注:指人脑)如何,把我们所自觉地、明确地认为是数学的东西,和这个系统适当地区分开来,这是不会错的。” [9]如果把冯•诺意曼讲的“数学的语言”进一步再细分成几何语言与算术语言,那他的观点就跟康德先验哲学完全一致了。


所以,我们追问“机器认识如何可能”,就跟康德追问“形而上学如何可能”、“纯粹数学如何可能”、“纯粹自然科学如何可能”是一样的,人脑和电脑都是要通过一些先验结构或数学范式来认识外部世界的,所谓认识,就是指这些数学范式之间的相互映射和相互转换。从认识论的观点看,几何直觉、逻辑分析和算术计算(数字计算)是三种基本的认识能力,它们都形成了各自庞大而复杂的数学体系,现代数学最前沿、最有创造性的领域就在于几何、算术和逻辑之间的交叉地带,像代数几何、范畴论、朗兰兹纲领等,重点都是要探索不同数学范式或数学结构的相互映射和相互转换。如果说过去数学的终极目标是追求其严谨性,那么未来数学的终极目标则是追求其统一性。AGI的崛起正好为数学的统一性提供了最强大的实验室。我们要探索大脑的奥秘,实现AGI的终极目标,最关键的还是要在数学基础研究上取得重大突破,找到一种描述不同数学范式相互映射、相互转换的基本理论体系。数学的统一性无疑将成为未来数学发展的最前沿,这也将是新一代计算机和AGI研究的核心。

 

四、结论:计算、编程和学习


自计算机诞生起,就是以编程为主,但人工编程这条路已逐渐走不通了,机器学习成为当前AI技术研发的主流。因为,能够编程的任务还是相对比较简单的,许多复杂的任务是根本没法去编程的。那么,计算、编程和学习究竟是什么样的关系呢?


计算和编程都属于算术范式之内的工作,计算就是写出一个递归函数,而编程就是求解这个递归函数,很多情况下,我们能写出一个代数方程,但却根本解不出这个方程。因此,计算就相当于计算复杂性中的N类问题,而编程就相当于NP类问题,人们倾向于认为这两类问题是不等价的。可编程的问题只是可计算的问题一个很小的真子集。


如果问题不能编程,那么机器就没法处理这些问题,此时就需要通过机器学习来解决之。学习是一种通过数据和经验的积累,逐渐形成新概念和新知识的认识过程,其核心就是几何直觉和逻辑分析。计算机不能自我编程,因为其内部的先验结构都是算术范式,它是不连续和不完备的;而学习机能自我编程,因为其内部的先验结构还有几何范式和逻辑范式这两种,它们是连续性和完备性的。计算机和学习机的内部结构是根本不同的。


这就是我们提出机器认识论的主要观点,机器要能实现自我编程,它内部就必须具有一些不同于图灵机的数学结构,这些数学结构其实并不神秘,就是我们熟悉的几何结构和逻辑结构。图灵机是离散性和不完备性的算术结构,而学习机是连续性的几何结构和完备性的逻辑结构,我们称之为“哥德尔机” [10] 。我们还证明了一个重要的数学定理:只要有足够的数据输入,具有完备逻辑结构的机器就能自动编程[11]。当然,这个定理也适用于具有连续几何结构的机器,它证明了通用学习机是存在的。


概言之,通用学习机的存在性是一个基本数学定理,它是机器学习的核心,也是AGI的基石,相当于计算机中的“丘奇-图灵论题”。有了这条基本数学定理,我们就可以来大胆地设想和设计具有认知能力的通用智能机器了。

 

 

参考文献:

[1]戴密斯·哈萨比斯,“超越人类认知的极限”,文章来源:https://www.sohu.com/a/134114430_640189

[2]钟义信,“机制主义人工智能理论——一种通用的人工智能理论”[J],《智能系统学报》,2018,13(1):pp2-18。

[3] (美)王浩:《逻辑之旅:从哥德尔到哲学》,浙江大学出版社200年版,第六章。

[4]A. M.Turing(1938) ,“Systems of logic based on ordinals”, transcribed by Artificial Intelligence and Computer Science Laboratory, Universidade do Porto, Portugal, September 18, 2014.

[5]A.M.图灵,“计算机器与智能”,载于《人工智能哲学》,上海译文出版社2001年版,pp83-90。

[6]Rumelhart D,Hinton G,Williams R(1986):“Learning internal representations by error propagation”,in Parallel Distributed Processing,chapter 8.MIT Press,Cambridge,MA.

[7]Jacob Bellmund, Christian Doeller,Edvard Moser:“Navigating cognition: Spatial codes for human thinking”,http://science.sciencemag.org/content/362/6415/eaat6766

[8]诺意曼:《计算机与人脑》,商务印书馆1965年版,pp59-60。

[9]L.E.J.布劳威尔,“直觉主义和形式主义”,载于《数学哲学》,商务印书馆2003年版,p93。

[10]Chenjun Lv,Xiaohui Zou(2018): “How to Understand the Mathematical Basis of Two Basic Types of Computational Behaviorhttps://link.springer.com/chapter/10.1007/978-981-13-7983-3_27?from=timeline&isappinstalled=0.

[11]Chuyu Xiong(2016):“Discussion on Mechanical Learning and Learning Machine”, https://arxiv.org/pdf/1602.00198.pdf.

 

 




https://blog.sciencenet.cn/blog-3282433-1193331.html

上一篇:两种科普的概念:刍议新时代的科学精神
下一篇:AI发展史:从通用计算机到通用学习机
收藏 IP: 120.244.108.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 07:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部