信息学基础研究分享 http://blog.sciencenet.cn/u/geneculture 语言理解&知识表达

博文

第十一章 文化语言从人文到数学(2023融智学导读)

已有 592 次阅读 2023-2-1 20:45 |个人分类:学术研究|系统分类:科研笔记

第十一章 文化语言从人文到数学

导读:人类是会说话、有语言且有文字的高等动物。会说话,就意味着不仅有文化,而且还懂礼仪。有语言且有文字,不仅限于自然语言的母语和至少一门外语,而且,还应该拓展至数学和计算机编程语言及其相应的符号体系,更重要的是能够拓展至一系列大跨界的专业的术语及其相应的俗语。融智学所强调的英汉、语数、术俗三类双语就是其最典型的代表

近期,已拓展至AI语数英及其辅助各级各类教育的集大成、融大智、共大享的GPXS平台。其特点是:宏微贯通的文化基因系统工程和人文科技融会贯通的十大学部很好地结合,不仅对各级各类学校的改革具有加速催化作用,而且对中国作为人口和教育以及高等教育的大国再进一步发展成强国的进程也具有加速催化作用,进而,还会对世界范围人类文化的传承和创新步伐的加速起到助推甚至发展至主推的作用和进一步的加速催化作用。

图1和图2结合展示言识软硬教管学用八大系统工程暨文化基因系统工程

由图1和图2可见,两图之间的绿色通道及其所揭示的语言、知识、软件,既是智慧、智力、智能“三智”融通融合的具体成果体现,又是人机双脑三智暨心智的三重属性体现,更是:图1和图2结合展示在融智学语境下的言识软硬教管学用八大系统工程暨文化基因系统工程的集中体现的示意图。

第一节 英汉双语(狭义双语思维训练)

导读:自从言和语的关系(理论分析)数据库(实际应用)获得实质性突破以来,不仅字与字组的关系数据库及其有针对性地调用(双重形式化中文信息处理系统工程理论与实际高度结合的实践)得到了验证,而且进一步推广至双重形式化英文信息处理系统工程理论与实际高度结合的实践也得到了相应的验证。其理由就是:既然有语言(首当其冲的就是自然语言)会说话,是人类的根本属性,那么,我们的大中小学生就有必要同时掌握世界上应用最广泛的英语和人口最多的汉语及其配套的思维、认知和认识的习惯或能力。

参照附录1和附录2可这样来安排:常用汉字3500个、中学阶段6000个和通用汉字8105个;基础英语单词800-2000个、中级英语单词2500~3000个,高级英语单词5000-7000个,超级英语单词10000-20000个。在此基础上或在其背景下来分别考虑基础教育阶段、过渡教育阶段和高等教育阶段的英汉狭义双语思维训练,绝不是仅仅记住英汉双语的基本词汇,而是要进一步对其人机交互、协作乃至协同的应用场景(我们时代的显著特征之一),和人际、人机、机际、机人之间“合理分工,优势互补;高度协作,优化互动”的方针得以被理解并贯彻执行到位的另类双语(专家术语和大众俗语)与广义双语(自然语言和人工语言尤其是数学语言及其它们结合的计算机编程开发语言)结合起来,做三类双语的刻意练习即思维训练和操作训练。

图3 基于融智学的言和语的关系原理而设计翻译和机译的蝴蝶模型

由图3可见,邹晓辉基于融智学的言和语的关系原理而设计翻译和机译的蝴蝶模型(见一种崭新的机器翻译策略,针对此前机器翻译依据的基本假设存在的问题,分别从普通语言学的研究对象和基本翻译策略的角度,论述了一种崭新的机器翻译策。其优点,不仅在于它能更有针对性地消解汉英双语转换必然遭遇的各种歧义,具体指:语汇和语句两个层次多个结构单位对译的取舍问题,而且还在于它既有利于计算机更恰当地处理自然语言也有利于自然人更方便地用计算机处理自然语言。2011年发表)

第二节 术俗双语(另类双语思维训练)

导读:专业术语与日常俗语或专家术语和大众俗语,在融智学的视域被视为另类双语。这样做,对于跨学科、跨领域、跨行业、跨语种、跨媒体、跨地域、跨时代、跨圈层等大跨界的文化交流十分有效。举例来说,化学元素周期表以及决定所有化学反应两边物质不灭暨质量守恒的基本定律,机械、声、热、电、光、核等物理学多种能量形式的相互转换与守恒定律,对于化学能与生物能也是有效的。因此,描述它们的专业术语与日常俗语或专家术语和大众俗语可根据特定的学术名词或术语达成统一。

图4 三大奥秘与八大物类(两极的无机物+中间的有机物见生物六界说)

由图4可见,宇宙、生命、脑智三大奥秘与(两极的无机物+中间的无机物与六类有机物)八大物类体系。在此,专家术语与大众俗语是可相对统一的。

图5 八大学问体系增加交叉与综合两部即构成融智学的十大学部

由图5可见,在八大学问体系的基础之上,再增加交叉与综合,即构成融智学的十大学部。其中,每个部分都有其分支。通常说的“隔行如隔山”就是因为各行各业都有其自身的专业术语或专家术语。如果各个方面的高深知识探讨要做到跨学科、跨领域、跨行业、跨语种、跨媒体、跨地域、跨时代、跨圈层等大跨界的文化交流,那么,就必须有与普罗大众的常识匹配的俗语(可普及到中小学),来对接方方面面的专业术语(主要在大学的本硕博阶段)。用融智学定义人类认知第一次大飞跃,八大学问体系,人类认知第二次大飞跃,十大学部。

图6 融智学的十大学部由八大学问体系增加交叉与综合两个部分而构成

由图6可见,融智学的十大学部由八大学问体系增加交叉与综合两个部分而构成,其中,AI辅助建构的GXPS(涵盖GLPS,GKPS,GSPS,GHPS)与人类脑智&心智(由语言、知识、软件的三重性,即:特征、属性、标志,及其蕴含的三大类因素集群,化繁为简,以简驭繁)均可通过专家术语与大众俗语(另类双语)加以系统地表达,进而,可有针对性地调用。

第三节 语数双语(广义双语交互设计)

导读:算术数字和语言文字,在融智学的视域被视为广义双语。其特征在于三类孪生图灵机暨三类双重形式化理解模型得以建立。从而,为进一步发挥语言、知识、软件的三重性,及

三大类因素集群的巨大作用。

图7和图8三类孪生图灵机暨三类双重形式化理解模型和ABCD四库的关系

由图7和图8结合可见,三类孪生图灵机暨三类双重形式化理解模型和ABCD四库的关系,均为脑智(硬件载体+语言、知识、软件三重性及其体现的三智)。其中,核心底层逻辑及其数学原理是各种数系和进制之间的自动化批处理,结合人机交互、协作、协同,体现出人机互助的综合优势。全球语言定位系统(GLPS)和全球知识定位系统(GKPS)以及全球软件定位系统(GSPS)的底层数理逻辑是一致的。区别仅在于人机交互界面及其对象符号体系。

表1多种进制之间的换算关系实例一览表和图9 广义双语支撑的三类双语数据库

由表1和图9结合可更好地帮助读者理解广义双语数据库里的一系列左列表ID数字与多种进制之间的换算关系和右列表汉字和汉语(一系列字组)之间的自动化批处理之间的关系。可以说,图7和图8以及图9结合所展示的不仅是一系列孪生图灵机暨双重形式化理解模型而且已经涵盖了实用的中文全球语言定位系统(GLPS)。图9 展示了语数广义双语数据库。它实质上就是言和语的关系数据库以汉字和汉语(由各级字组构成)为例的广义双语实例。

附录1:根据2012年教育部开始实施的语文新课标,小学生的识字量要求为:一、二年级学生须累计认识常用汉字1600个左右,其中会写800个;三、四年级学生须累计认识常用汉字2500个左右,其中会写1800个;五、六年级学生须累计认识常用汉字3000个左右,其中会写2500个。

根据2011版初中语文新课程标准

识字与写字  

1能熟练地使用字典、词典独立识字,会用多种检字方法。累计认识常用汉字3500个左右。  

2在使用硬笔熟练地书写正楷字的基础上,学写规范、通行的行楷字,提高书写的速度。

一般高中学历的成年人(基础非常扎实)大约掌握五千5000到六千6000个汉字。

常见汉字就是国标一、二汉字,共6763,常用汉字与次常用汉字也就3000多字,一般人能认识4000个汉字,再加上汉字读半边,6000个不成问题。

九年义务教育的要求识字量为6600字左右

2013年8月19日国务院颁布实施的《通用规范汉字表》共计8105个汉字,其中一级汉字为3500个;二级汉字3000个,三级汉字1805个。

附录2

(1)C.K.Ogden和I.A.Rechards曾列出学习英语最常用的850个单词(Basic English Word List)并成功地运用这些单词简写过一些英国文学名著,这些词可作为英语初学者第一步需要掌握的。

(2)我国中学英语教学大纲明文规定中学生到毕业时需掌握2500个单词。

(3)英国郎曼公司出版的《郎曼当代英语词典》(Longman Dictionary of Contemporary English)后附有一个2000单词的词表,该词典就是使用这些词汇给所有词条下定义的,可见,这些词汇是学习英语最基础的词汇,这是每个学习者都应掌握的词汇

(4)我国高等院校非英语专业的本科生所参加全国英语四级考试,这考试大纲列出了约5000单词。根据词频调查表明,这5000单词的覆盖率约为97%,即每一百单词中仅有3个单词不在大纲中。这样,掌握了大纲要求的词汇后,再掌握几百个专业词汇,就可基本满足阅读英语专业文章的需求。

(5)我国公派出国留学人员需要通过EPT考试,才可以出国,这种考试要求掌握的词汇约7000个。

(6)赴美留学需通过TOEFL考试,这种考试要求掌握的词汇约7000~8000个。

(7)赴美攻读博士学位的留学生需通过GRE考试,要求掌握10000个单词。也是我国英语专业本科生所需要掌握的词汇数量。只要词汇量达到这个水平,就可以顺利地阅读英语文学作品、报刊等原著。

(8)享誉世界的英国文学大师莎士比亚一生写了许多作品,据有关人士统计调查所用词汇量大约为20000个。

(9)以英语为母语的英美国家,一般需要掌握20000~30000个单词,受过高等教育或从事语言研究方面的英美人可掌握40000~50000个单词。

(10)说了这么多,那么英语到底有多少单词呢?我们可以从许多资料中找到答案,例如:1993年出版的13卷本牛津英语词典(the13-volume Oxford English Dictionary)共收编各类词汇达414825个;1961年出版的威布斯特国际第三版词典(Webster’s Third New International Dictionary)共收编各类词汇达450000个;1979年出版的柯林斯英语词典(Collins Dictionary of English Language)共收编各类词汇达3000000个。随着社会在进步,语言也在不停的发展,有语言学家预测英语词汇数量在未来50年将会超过5000000个。

对个人而言,应该掌握多少单词呢?

如仅仅想阅读一些英语文章,那有6000左右即可;

如想出国留学,还想读一些自己所学专业的英语文章,那就需要掌握8000左右;

如想顺利阅读关于英文的外国原著,那就需要掌握10000个单词左右。

根据个人需求,选择要掌握词汇量的程度。

掌握的词汇中,大致分两大类:积极词汇和消极词汇。

积极词汇是指会说会写,能正确使用的词汇,不仅知道它们的音、形、义,还应知道它们的语法功能、搭配用法、文化含义等,这样的词汇大约需要2500~3000个。

大部分都是消极词汇,只要能够听懂、读懂就行。




https://blog.sciencenet.cn/blog-94143-1374429.html

上一篇:为什么数理化等理工科的课程必须做题?而且最好能够系统地做练习!介绍我要学的两个七遍通方法
下一篇:第十二章 大道至简从神学到哲学(2023新版融智学导读)
收藏 IP: 116.31.52.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-28 19:58

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部