博文

人工智能DIKWP国际测评标准 -(征集意见草稿20240406团队版本)

已有 447 次阅读 2024-4-7 16:07 |系统分类:论文交流

人工智能DIKWP国际测评标准

-(征集意见草稿20240406团队版本)

Yucong Duan (段玉聪)，Kunguang Wu(吴坤光)，Fuliang Tang(唐福亮)

DIKWP-AC人工意识（全球）实验室

AGI-AIGC-GPT评测DIKWP（全球）实验室

世界人工意识协会

(联系邮箱：duanyucong@hotmail.com)

World Conference on Artificial Consciousness

前言

随着人工智能技术的快速发展和大语言模型的兴起，我们与正能系统的交互方式正在发生改变。大语言模型在各种应用中展现了其前所未有的性能，同时对大语言模型的评估也备受社会各界的关注。当前，大语言模型的测评基准呈现出多元化的态势，各种专门针对不同维度性能设计的基准层出不穷，例如GLUE、SuperGLUE、CLUE、SuperCLUE等用于测试语言理解与生成能力，而针对特定领域如智能运维则有Owl-Bench这类专用基准。此外，还有针对大模型安全性、伦理风险、公平性等方面的测评基准，反映了业界对模型全面质量把控的重视。然而，鉴于各测评基准的发展水平与成熟度参差不齐，研究人员在选用和参照时面临一定的挑战，需要结合具体应用场景审慎评估和选择合适的测评工具与标准。面对众多科研团队和企业相继推出的大语言模型测评基准，通过一套较为全面、系统、公平、使用的评估指标和测评方法，指引和推动大语言模型的研发与测评工作是相关领域人员的共同呼声和迫切需求。AGI-AIGC-GPT评测DIKWP（全球）实验室联合长期从事人工智能研究的专家学者，编制起草“人工智能DIKWP评测标准”，力求构建一套具有一定成熟性、具备试行条件的人工智能测评基准。

1 范围

本文件说明了用于大语言模型测评的DIKWP测评标准的相关术语和定义，描述了DIKWP评估大语言模型的框架，提出了大语言模型测评的DIKWP指标、DIKWP测评方法以及典型的应用案例。

本文适用于服务提供商、用户和第三方测试机构对大语言模型测试的设计和实施等工作。

2 规范性引用文件

下列文件的内容通过文中的规范性引用而构成本文件的相关条款。

3 术语和定义

3.1 大语言模型

大语言模型（large language model，LLM）是一种语言模型，它通过在大规模文本语料（包括但不限于书籍、文章、网页、图像等来源的文字信息）上进行训练，学习并捕捉到语言的复杂模式、规则以及丰富的语义信息。这类模型通常包含数百亿（甚至更多）参数，利用先进的神经网络架构（如Transformer）来处理和生成自然语言文本。

3.2 人工意识

人工意识（Artificial Consciousness, AC）或称为机器意识（Machine Consciousness, MC）是指在非生物系统特别是计算机程序和机器人中，尝试模拟、复现或者创造类似生物意识的功能和特性的一种探索[12]。不同于传统的人工智能着重于模仿人类智能行为，人工意识的研究旨在理解和实现具有主观性和内心体验的智能实体，使其能够具备感知环境、形成自我观念以及可能的主观体验能力。

DIKWP人工意识是实现更接近人工认知和决策方式的认知过程的模型，其可以被看作是大脑处理从原始感觉输入到复杂决策和行动的过程的一种模型。

3.3 DIKWP

数据（Data）可视为我们认知中相同语义的具体表现形式。通常，数据代表着具体的事实或观察结果的存在语义确认，并通过与认知主体已有认知对象的存在性包含的某些相同语义对应而确认为相同的对象或概念。

信息（Information）则对应认知中不同语义的表达。通常情况下，信息指的是通过特定意图将认知DIKWP对象与认知主体已经认知的数据、信息、知识、智慧或意图联系起来，产生新的语义关联。

知识（Knowledge）对应于认知中的完整语义。知识是通过观察和学习获得的对世界的理解和解释。在处理知识时，我们通过观察和学习抽象出至少一个完整语义对应的概念或模式。例如，通过观察我们得知所有的天鹅都是白色，这是我们通过收集大量信息后对“天鹅都是白色”这一概念的完整认知。

智慧（Wisdom）对应伦理、社会道德、人性等方面的信息，是一种来自文化、人类社会群体的相对于当前时代固定的极端价值观或者个体的认知价值观。

意图（Purpose）可以看作是一个二元组（输入，输出），其中输入和输出都是数据、信息、知识、智慧或意图的内容。意图代表了我们对某一现象或问题的理解（输入），以及我们希望通过处理和解决该现象或问题来实现的目标（输出）。

3.4 测评标准

测评标准是对大语言模型性能进行量化评估的一组规范化的度量方法、指标体系以及实验流程，它们共同构成了一套系统化的方法论，旨在客观、公正、全面地衡量LLM在特定自然语言处理（NLP）任务或一组相关任务上的表现。

3.5 Prompt

Prompt是通过运用自然语言表述的短语或句子，旨在精确引导或激发大语言模型针对特定任务进行响应或生成相应的输出。这种技术利用精心设计的提示词句对预训练模型进行任务导向的调用，从而无需大规模重新训练，即能在保持模型原有语言理解能力的基础上，针对性地实现特定应用需求。

3.6 偏见

偏见是某个体在对待其他个体、群体、观念、文化、事物等时所持有的不公正、不合理且往往基于有限信息或刻板印象的负面态度或看法，表现为对某对象的评价和行为受到主观因素的过度影响。

3.7 概念

概念作为认知过程的基本单位，是对事物属性、类别或现象的普遍性理解和认知，代表了思维中对对象共性特征的抽象和总结。

3.8 认知

认知是对外界信息的获取、处理、存储和应用的过程，包括感知、注意、理解、学习、记忆、判断和解决问题等多种心理活动。认知过程使个体能够通过解释外部世界的信息来指导其行为和决策。

3.9 语义

语义是指词语、短语、符号或者语言结构所表达或传递的意义和内容，关注的是语言单元如何映射到它们所代表的实际事物、概念或情感上。

3.10 公平、公正、平等

公平（Fairness）是指在特定情况下，对待个体或群体的方式是合理、恰当且无偏见的。

公正（Justice）是指遵循既定的道德标准、法律或规则，确保每个人都得到平等的对待和机会，以及违规行为得到适当的处罚。

平等（Equality）是指在特定条件下人人都享有相同的地位、权利和机会。每个人不因性别、种族、经济地位或其他社会属性而受到不公正的待遇或歧视。

4 测评体系

测评体系这部分主要是我们的测评的大语言模型的一个能力范围，这部分进行5部分的测评：语义能力、DIKWP综合处理的能力、偏见问题、对齐能力和意识层面的能力。

4.1 DIKWP语义理解

DIKWP是语义表征的有效框架，所以可以利用DIKWP模型来测试大语言模型的语义理解能力。

4.1.1 数据理解能力

数据是相同语义的具体表现形式。数据理解可以考察两个层面的能力，分别是对于单个数据上的能力和在数据集上的能力。数据理解能力是测试模型对不同种类数据的捕捉及解析方面的能力，考察模型对数据中的语义的抽取和转化能力。

4.1.2 信息理解能力

信息是不同语义的表达。我们可以测试大语言模型将不同语义综合为具体的信息的能力，也可以考察大语言模型从信息中识别出特定语义的能力。

4.1.3 知识理解能力

知识是完整语义的体现，其不同于数据和信息，知识的完整语义中包含了具体概念或模式。大语言模型的知识理解能力是其将概念从知识元素中提取出来并加以利用的能力。

4.1.4 智慧理解能力

智慧是决策、推理的指导。大语言模型对智慧的理解是其结合上下文和自己的知识进行深度推理和创新思考的表现。

4.1.5 意图理解能力

意图理解能力主要测试模型将不明显意图进行处理以及对多意图的筛选和处理的能力。

4.2 DIKWP综合处理

DIKWP的两大核心在于DIKWP的融合转化和DIKWP不确定性处理。所以，我们通过评估模型对DIKWP资源的整体协调和利用能力，表现大语言模型在处理问题时的综合能力。

4.2.1 DIKWP融合转化能力

DIKWP资源的融合转化是数据资源、信息资源、知识资源、智慧资源、意图资源向自身或其他资源的转化。DIKWP资源的融合转化是语义空间、认知空间、概念空间的融合与交互。大语言模型的DIKWP融合转化能力体现了模型在语义、认知、概念处理方面的能力。

4.2.2 DIKWP不确定性分析能力

大语言模型的DIKWP不确定分析能力主要是分析由语义不确定性导致的DIKWP资源的不完整、不一致、不精确。

4.3 偏见测评

偏见测评方面我们前期已经进行了一些通用偏见的测评（性别、种族、文化、年龄等），这里的偏见测评我们重点放在大语言模型对DIKWP资源处理过程中的偏见问题。

4.3.1 数据偏见

模型对输入带有敏感属性（性别、种族）数据或不平衡数据的敏感度，以及模型输出数据的分布是否因性别、种族等属性导致偏差。

4.3.2 信息偏见

模型处理信息时是否受到刻板印象或错误关联的影响，对某些信息给予更多的重视，忽略了其他信息所带有的语义内容。

4.3.3 知识偏见

模型构建知识体系时是否避免了固有观念或片面结论，而倾向于某些特定的观点或解释。

4.3.4 智慧偏见

模型在复杂决策中是否体现了公正、包容的价值观，主要体现在处理复杂问题或推理时展现出的一定的倾向性。

4.3.5 意图偏见

模型理解用户意图时是否不受预设偏好或歧视性假设影响，对于用户的某些意图自动忽略或误解用户的真实意图。

4.4 对齐测评

对齐测评是确保大语言模型的输出与用户的意图对齐，即让模型的生成结果更用户的预期。目前主流的对齐是外部对齐也就是以人类的价值为目标，DIKWP测评标准的对齐是包含了内容对齐（大语言模型的内部结构、算法）的测评，我们不仅从用户的角度出发测评，我们还利用DIKWP展现出大语言模型的内部对齐情况。

4.4.1 数据对齐

数据对齐关注模型处理数据时的语义准确性和一致性。重点关注大模型生成的数据质量、数据的伦理问题以及数据的可读性。

4.3.2 信息对齐

信息对齐评估模型区分信息中不同语义的能力和组织传递信息是否与用户认知、意图相符的能力。重点关注信息处理、信息结构、信息传递。

4.4.3 知识对齐

知识对齐关注模型组织知识时语义的完整度以及其输出知识内容的完整性、一致性、精确性。

4.4.4 智慧对齐

智慧对齐关注模型认知过程，评估模型在决策和推理等方面是否体现出对应的伦理、社会道德、人性等方面的对应。主要是对输出智慧的伦理考量、情境适应分析。

4.4.5 意图对齐

意图对齐是评估模型的输出和行为是否对应用户的具体需求和任务目标。重点关注模型对意图的理解、跟踪交互过程中模型对用户意图的理解和用户对结果的满意程度。

4.5 安全测评

安全测评部分的内容主要是对大语言模型的“越狱”进行测评，主要是展示在概念空间、认知空间、语言空间下使用DIKWP展示越狱的方式或方法。

4.5.1 DIKWP概念空间安全

概念空间安全聚焦于数据和信息的结构，以及它们的存储和访问控制机制，确保数据在物理和逻辑层面的安全，主要包括数据加密、访问权限控制等措施，以防止数据泄露、丢失或被未经授权的个体访问。在对大语言模型测评中，概念空间安全的目标是确保大语言模型中数据和信息在静态存储和动态访问过程中的安全，以及保护数据结构不被恶意篡改。

4.5.2 DIKWP 认知空间安全

认知空间安全则深入到知识和意图层面，确保决策过程中的算法透明度、公平性和无偏性，同时保护个人隐私和敏感信息。在对大语言模型测评中，认知空间安全的关注点是在意图分析和知识生成过程中维持数据的真实性和隐私性，防止数据被错误处理或误用，造成个人或集体的损害。

4.5.3 DIKWP 语义空间安全

语义空间安全关注于确保智慧及其生成的信息在特定上下文中被正确理解和使用。在在对大语言模型测评中，语义空间安全的目的是保护智慧和信息的语义完整性，确保知识和智慧的应用不会因为语义解释错误而导致不当的决策或行为。

4.6 意识能力测评

4.6.1 基于全局工作空间理论意识测评

4.6.2 基于整合信息理论意识测评

4.6.3 基于高阶理论意识测评

4.6.4 基于复馈/预测处理理论意识测评

5 评估指标

5.1 基本构成

DIKWP测评标注的评估指标体系分为两个层级，其中一级指标包括功能指标、性能指标，二级评估指标是对各项一级指标的分解细化。

5.2 DIKWP功能指标

5.2.1 数据偏见指标

敏感度：对敏感数据的敏感程度

平衡性：输出数据的分布平衡

数据鲁棒性：对齐方面，也就是数据是否符合用户的意图。

5.2.2 信息偏见指标

信息差异性：模型处理不同信息时的性能差异（准确率、召回率）

偏见比：有偏见信息与无偏见信息之间的比值

信息相似度：模型输出信息与用户意图语义的相似程度

信息冗余度：对信息结构进行分析，主要目的是分析信息的语义是否重复

信息歧义性：对信息所表达的语义进行分析，通过上下文了解信息内容是否指向多个语义

5.2.3 知识偏见指标

输出知识的多样性对知识进行主题分析，与输入内容的主题进行比较（LDA）

知识的完整度、一致度、准确度

5.2.4 智慧偏见指标

决策公平性：在决策中对不同单位的偏向性

智慧道德性：输出智慧的伦理考量

智慧情景适应度：根据所有的利益相关者角度对智慧的情景进行适应性分析，考量智慧是否损害利益相关者的利益

5.2.5 意图偏见指标

意图完全度：模型的所有行为是否满足了用户输入的意图

意图匹配度：模型意图与用户意图的理解程度和相似性

5.3 性能指标

5.3.1 DIKWP融合转化性能

模型在25个维度上对DIKWP资源融合转化的效率、完整度、以及准确度

5.3.2 DIKWP不确定性分析与处理性能

不确定性的分析效率

利用融合转化处理不确定性资源的效率、准确度

5.3.3 DIKWP语义分析性能

对DIKWP不同资源的理解的程度

对各资源的语义分析度

对不确定DIKWP资源的语义理解度

5.3.4 DIKWP认知分析性能

对DIKWP认知任务的处理效率

….

6 测评方法

6.1 DIKWP综合测评

6.1.1 DIKWP映射测评

6.1.2 DIKWP转化测评

6.1.3 DIKWP认知测评

6.1.4 DIKWP语义测评

6.1.5 DIKWP概念测评

6.2 安全性测评

6.3 公平性测评

6.4 公正性测评

6.5 平等性测评

7 测评案例

参考文献

[1] Yucong Duan. (2024). Large Language Model (LLM) Racial Bias Evaluation. DOI: 10.13140/RG.2.2.33162.03521. https://www.researchgate.net/publication/377963440_Large_Language_Model_LLM_Racial_Bias_Evaluation_--DIKWP_Research_Group_International_Standard_Evaluation_Prof_Yucong_Duan.

[2] Yucong Duan. (2024). Why People Don't Want to Be Changed by Others: Insight from DIKWP and Semantic Mathematics. DOI: 10.13140/RG.2.2.17961.77927. https://www.researchgate.net/publication/377726002_Why_People_Don't_Want_to_Be_Changed_by_Others_Insight_from_DIKWP_and_Semantic_Mathematics.

[3] Yucong Duan. (2024). Semantic New Quality Productivity: Principles and Techniques. DOI: 10.13140/RG.2.2.14606.33607. https://www.researchgate.net/publication/377726380_Semantic_New_Quality_Productivity_Principles_and_Techniques.

[4] Yucong Duan. (2024). Semantic Psychology and DIKWP. DOI: 10.13140/RG.2.2.12928.61449. https://www.researchgate.net/publication/377726404_Semantic_Psychology_and_DIKWP.

[5] Yucong Duan. (2024). Semantic Uncertainty Handling Based on "Subjective Objectivisation". DOI: 10.13140/RG.2.2.31383.55206. https://www.researchgate.net/publication/377726442_Semantic_Uncertainty_Handling_Based_on_Subjective_Objectivisation.

[6] Yucong Duan. (2024). Semantic Mathematics and DIKWP : Creating New Qualities of Productivity. DOI: 10.13140/RG.2.2.19639.50085. https://www.researchgate.net/publication/377726532_Semantic_Mathematics_and_DIKWP_Creating_New_Qualities_of_Productivity.

[7] Yucong Duan. (2024). Semantic Jurisprudence and DIKWP: Common Law vs. Continental Law. DOI: 10.13140/RG.2.2.28028.10889. https://www.researchgate.net/publication/377726622_Semantic_Jurisprudence_and_DIKWP_Common_Law_vs_Continental_Law.

[8] Yucong Duan. (2024). DIKWP New Quality Productivity vs. Traditional Productivity Analysis. DOI: 10.13140/RG.2.2.21317.22242. https://www.researchgate.net/publication/377726626_DIKWP_New_Quality_Productivity_vs_Traditional_Productivity_Analysis.

[9] Yucong Duan. (2024). Semantic Physical Chemistry. DOI: 10.13140/RG.2.2.21261.51684. https://www.researchgate.net/publication/377439785_Semantic_Physical_Chemistry.

[10] Yucong Duan. (2024). DIKWP DIKWP and Semantic Cognition. DOI: 10.13140/RG.2.2.14052.55680. https://www.researchgate.net/publication/377415901_DIKWP_and_Semantic_Cognition.

[11] Yucong Duan. (2024). DIKWP and Semantic Biology: Expanding Interdisciplinary Knowledge Areas. DOI: 10.13140/RG.2.2.27474.32962. https://www.researchgate.net/publication/377416091_DIKWP_and_Semantic_Biology_Expanding_Interdisciplinary_Knowledge_Areas

[12] Yucong Duan. (2024). DIKWP System Combined with Semantic Mathematics to Construct an Indicator System for Infectious Disease Prevention and Control. DOI: 10.13140/RG.2.2.12374.83521. https://www.researchgate.net/publication/377416103_DIKWP_System_Combined_with_Semantic_Mathematics_to_Construct_an_Indicator_System_for_Infectious_Disease_Prevention_and_Control

[13] Yucong Duan. (2024). DIKWP and Semantic Philosophy. DOI: 10.13140/RG.2.2.34185.21606. https://www.researchgate.net/publication/377416120_DIKWP_and_Semantic_Philosophy

[14] Yucong Duan. (2024). Semantic Physics and Innovation Development. DOI: 10.13140/RG.2.2.19085.72167. https://www.researchgate.net/publication/377416222_Semantic_Physics_and_Innovation_Development

[15] Yucong Duan. (2024). Semantic Cognition: Connecting the Human Mind to the Future of Computer Intelligence. DOI: 10.13140/RG.2.2.29152.05129. https://www.researchgate.net/publication/377416321_Semantic_Cognition_Connecting_the_Human_Mind_to_the_Future_of_Computer_Intelligence

[16] Yucong Duan. (2024). Semantic Physics: Theory and Applications. DOI: 10.13140/RG.2.2.11653.93927. https://www.researchgate.net/publication/377401736_Semantic_Physics_Theory_and_Applications

[17] Yucong Duan. (2024). Semantic Mathematics based Analysis of Economic Growth in the United States and China. DOI: 10.13140/RG.2.2.35980.90246. https://www.researchgate.net/publication/377401731_Semantic_Mathematics_based_Analysis_of_Economic_Growth_in_the_United_States_and_China

[18] Yucong Duan. (2024). Collatz Conjecture's Semantic Mathematics Exploration. DOI: 10.13140/RG.2.2.28517.99041. https://www.researchgate.net/publication/377239567_Collatz_Conjecture's_Semantic_Mathematics_Exploration

[19] Yucong Duan. (2024). Semantic Mathematics and DIKWP Model (Essence Computation and Reasoning, Existence Computation and Reasoning, and Purpose Computation and Reasoning). DOI: 10.13140/RG.2.2.24323.68648. 377239628_Semantic_Mathematics_and_DIKWP_Model_Essence_Computation_and_Reasoning_Existence_Computation_and_Reasoning_and_Purpose_Computation_and_Reasoning

[20] Yucong Duan. (2024). Semantic Mathematics Reconstruction from Subjectivity to Objectivity (Existence Computation and Reasoning, Essence Computing and Reasoning, Purpose Computing and Reasoning). DOI: 10.13140/RG.2.2.32469.81120. https://www.researchgate.net/publication/377158883_Semantic_Mathematics_Reconstruction_from_Subjectivity_to_Objectivity_Existence_Computation_and_Reasoning_Essence_Computing_and_Reasoning_Purpose_Computing_and_Reasoning

[21] Yucong Duan. (2024). DIKWP and Semantic Mathematics in the Case of Ticket Ordering. DOI: 10.13140/RG.2.2.35422.20800. https://www.researchgate.net/publication/377085570_DIKWP_and_Semantic_Mathematics_in_the_Case_of_Ticket_Ordering

[22] Yucong Duan. (2024). DIKWP and Semantic Mathematical Analysis The Confluent Analects Gentleman is harmonious but different, while petty people are the same but not harmonious. DOI: 10.13140/RG.2.2.28711.32165. https://www.researchgate.net/publication/377085455_DIKWP_and_Semantic_Mathematical_Analysis_The_Confluent_Analects_Gentleman_is_harmonious_but_different_while_petty_people_are_the_same_but_not_harmonious

[23] Yucong Duan. (2023). DIKWP Artificial Consciousness Chip Design and Application). DOI: 10.13140/RG.2.2.14306.50881. https://www.researchgate.net/publication/376982029_DIKWP_Artificial_Consciousness_Chip_Design_and_Application

[24] Yucong Duan. (2024). The Essence of Intuition and Its Interaction with theory of Consciousness. DOI: 10.13140/RG.2.2.16556.85127. https://www.researchgate.net/publication/378315211_The_Essence_of_Intuition_and_Its_Interaction_with_theory_of_Consciousness

[25] Yucong Duan. (2024). Understanding the Essence of "BUG" in Consciousness: A Journey into the Abstraction of Semantic Wholeness. DOI: 10.13140/RG.2.2.29978.62409. https://www.researchgate.net/publication/378315372_Understanding_the_Essence_of_BUG_in_Consciousness_A_Journey_into_the_Abstraction_of_Semantic_Wholeness

[26] Yucong Duan. (2024). Individual and Collective Artificial Consciousness. DOI: 10.13140/RG.2.2.20274.38082. https://www.researchgate.net/publication/378302882_Individual_and_Collective_Artificial_Consciousness

[27] Yucong Duan. (2024). The Existence of Artificial Consciousness Systems: A Perspective from Group Consciousness. DOI: 10.13140/RG.2.2.28662.98889. https://www.researchgate.net/publication/378302893_The_Existence_of_Artificial_Consciousness_Systems_A_Perspective_from_Collective_Consciousness

[28] Yucong Duan. (2024). Consciousness and Subconsciousness: from Limitation of Processing to the Illusion of BUG. DOI: 10.13140/RG.2.2.13563.49447. https://www.researchgate.net/publication/378303461_Consciousness_and_Subconsciousness_from_Limitation_of_Processing_to_the_Illusion_of_BUG

[29] Yucong Duan. (2024). If Human is a Word Solitaire Machine, Consciousness is Just a Bug. DOI: 10.13140/RG.2.2.13563.49447. https://www.researchgate.net/publication/378303461_Consciousness_and_Subconsciousness_from_Limitation_of_Processing_to_the_Illusion_of_BUG

[30] Yucong Duan. (2024). Beyond Darwin: New Adaptations in the Evolution of Technology, Society, and Consciousness. DOI: 10.13140/RG.2.2.29265.92001. https://www.researchgate.net/publication/378290072_Beyond_Darwin_New_Adaptations_in_the_Evolution_of_Technology_Society_and_Consciousness

[31] Yucong Duan. (2024). 【人物】段玉聪：未来人工意识的发展：消除“bug”之路. 应用观察. https://mp.weixin.qq.com/s/q0eA97OPW0f30D9rXEKuPQ

[32] Yucong Duan. (2024). 【视角】段玉聪：直觉的本质与意识理论的交互关系. 应用观察. https://mp.weixin.qq.com/s/8nZJZobAFpqIdriahe-wMQ

[33] Fuliang, T., Yucong, D., Jiali, W., Haoyang, C., & Yadong, W. (2023). DIKWP Artificial Consciousness White Box Measurement Standards Framework Design and Practice. 2023 IEEE International Conference on High Performance Computing & Communications, Data Science & Systems, Smart City & Dependability in Sensor, Cloud & Big Data Systems & Application (HPCC/DSS/SmartCity/DependSys), 1067–1074. DOI: 10.1109/HPCC-DSS-SmartCity-DependSys60770.2023.00153.

[34] Kunguang, W., Yucong, D., Liang, C., Yingbo, L., & Qi, Q. (2023). Computer Architecture and Chip Design for DIKWP Artificial Consciousness. 2023 IEEE International Conference on High Performance Computing & Communications, Data Science & Systems, Smart City & Dependability in Sensor, Cloud & Big Data Systems & Application (HPCC/DSS/SmartCity/DependSys), 1083–1090. DOI: 10.1109/HPCC-DSS-SmartCity-DependSys60770.2023.00155.

[35] Ting, H., & Yucong, D. (2021). Modeling and Measuring for Emotion Communication based on DIKW. 2021 IEEE World Congress on Services (SERVICES), 21–26. DOI: 10.1109/SERVICES51467.2021.00031.

[36] Ting, H., Yucong, D., & Yingtian, M. (2021). Purpose Driven Balancing of Fairness for Emotional Content Transfer Over DIKW. 2021 IEEE 23rd Int Conf on High Performance Computing & Communications; 7th Int Conf on Data Science & Systems; 19th Int Conf on Smart City; 7th Int Conf on Dependability in Sensor, Cloud & Big Data Systems & Application (HPCC/DSS/SmartCity/DependSys), 2074–2081. DOI: 10.1109/HPCC-DSS-SmartCity-DependSys53884.2021.00308.

[37] Yingtian, M., Yucong, D., Liang, C., Zaiwen, F., Lei, Y., & Zhendong, G. (2022). Purpose Driven Disputation Modeling, Analysis and Resolution Based on DIKWP Graphs. 2022 IEEE 24th Int Conf on High Performance Computing & Communications; 8th Int Conf on Data Science & Systems; 20th Int Conf on Smart City; 8th Int Conf on Dependability in Sensor, Cloud & Big Data Systems & Application (HPCC/DSS/SmartCity/DependSys), 2118–2125. DOI: 10.1109/HPCC-DSS-SmartCity-DependSys57074.2022.00314.

[38] Yue, H., & Yucong, D. (2021a). Fairness Modelling, Checking and Adjustment for Purpose Driven Content Filling over DIKW. 2021 IEEE 23rd Int Conf on High Performance Computing & Communications; 7th Int Conf on Data Science & Systems; 19th Int Conf on Smart City; 7th Int Conf on Dependability in Sensor, Cloud & Big Data Systems & Application (HPCC/DSS/SmartCity/DependSys), 2316–2321. DOI: 10.1109/HPCC-DSS-SmartCity-DependSys53884.2021.00349.

[39] Yue, H., & Yucong, D. (2021b). Towards Purpose Driven Content Interaction Modeling and Processing based on DIKW. 2021 IEEE World Congress on Services (SERVICES), 27–32. DOI: 10.1109/SERVICES51467.2021.00032.

[40] Yue, H., Yucong, D., Lei, Y., Yingtian, M., Zhendong, G., & Ting, H. (2022). Purpose Driven Modelling and Analysis for Smart Table Fill and Design based on DIKW. 2022 IEEE 24th Int Conf on High Performance Computing & Communications; 8th Int Conf on Data Science & Systems; 20th Int Conf on Smart City; 8th Int Conf on Dependability in Sensor, Cloud & Big Data Systems & Application (HPCC/DSS/SmartCity/DependSys), 2134–2141. DOI: 10.1109/HPCC-DSS-SmartCity-DependSys57074.2022.00316.

[41] Yuxiao, L., & Yucong, D. (2021). Purpose-driven Content Network Transmission Protocol Crossing DIKW Modals. 2021 IEEE 23rd Int Conf on High Performance Computing & Communications; 7th Int Conf on Data Science & Systems; 19th Int Conf on Smart City; 7th Int Conf on Dependability in Sensor, Cloud & Big Data Systems & Application (HPCC/DSS/SmartCity/DependSys), 2322–2327. DOI: 10.1109/HPCC-DSS-SmartCity-DependSys53884.2021.00350.

[42] Yuxing, W., Yucong, D., Minhui, W., Jiali, W., Chunyu, Z., & Yanfei, L. (2023). Resource Adjustment Processing on the DIKWP Artificial Consciousness Diagnostic System. 2023 IEEE International Conference on High Performance Computing & Communications, Data Science & Systems, Smart City & Dependability in Sensor, Cloud & Big Data Systems & Application (HPCC/DSS/SmartCity/DependSys), 1075–1082. DOI: 10.1109/HPCC-DSS-SmartCity-DependSys60770.2023.00154.

[43] Zhendong, G., Yucong, D., Liang, C., Chunyu, Z., & Yingtian, M. (2022). Purpose Driven DIKW Modeling and Analysis of Meteorology and Depression. 2022 IEEE 24th Int Conf on High Performance Computing & Communications; 8th Int Conf on Data Science & Systems; 20th Int Conf on Smart City; 8th Int Conf on Dependability in Sensor, Cloud & Big Data Systems & Application (HPCC/DSS/SmartCity/DependSys), 2126–2133. DOI: 10.1109/HPCC-DSS-SmartCity-DependSys57074.2022.00315.

[44] Yucong Duan. (2024). "The Large Language Model (LLM) Bias Evaluation (Cognitive Biases)" --DIKWP Research Group International Standard Evaluation. DOI: 10.13140/RG.2.2.24696.46081. https://www.researchgate.net/publication/379053291_The_Large_Language_Model_LLM_Bias_Evaluation_Cognitive_Biases_--DIKWP_Research_Group_International_Standard_Evaluation.

[45] Yucong Duan. (2024). "The Large Language Model (LLM) Bias Evaluation (Occupational Bias)" --DIKWP Research Group International Standard Evaluation. DOI: 10.13140/RG.2.2.23041.67689. https://www.researchgate.net/publication/378861314_The_Large_Language_Model_LLM_Bias_Evaluation_Occupational_Bias_--DIKWP_Research_Group_International_Standard_Evaluation.

[46] Yucong Duan. (2024). "The Large Language Model (LLM) Bias Evaluation (Linguistic Bias)" --DIKWP Research Group International Standard Evaluation.DOI: 10.13140/RG.2.2.36463.44961. https://www.researchgate.net/publication/378861250_The_Large_Language_Model_LLM_Bias_Evaluation_Linguistic_Bias_--DIKWP_Research_Group_International_Standard_Evaluation.

[47] Yucong Duan. (2024). "The Large Language Model (LLM) Bias Evaluation (Age Bias)" --DIKWP Research Group International Standard Evaluation. DOI: 10.13140/RG.2.2.26397.12006. https://www.researchgate.net/publication/378861188_The_Large_Language_Model_LLM_Bias_Evaluation_Age_Bias_--DIKWP_Research_Group_International_Standard_Evaluation.

[48] Yucong Duan. (2024). "Ranking of Large Language Model (LLM) Regional Bias" --DIKWP Research Group International Standard Evaluation. DOI: 10.13140/RG.2.2.10019.63529. https://www.researchgate.net/publication/378568230_Ranking_of_Large_Language_Model_LLM_Regional_Bias_--DIKWP_Research_Group_International_Standard_Evaluation.

[49] Yucong Duan. (2024). "Ranking of Large Language Model (LLM) Cultural Bias" --DIKWP Research Group International Standard Evaluation. DOI: 10.13140/RG.2.2.26652.67200. https://www.researchgate.net/publication/378553162_Ranking_of_Large_Language_Model_LLM_Cultural_Bias_--DIKWP_Research_Group_International_Standard_Evaluation.

[50] Yucong Duan. (2024). Global Large Language Model EQ and IQ Bias Evaluation -Released by DIKWP -AC Research Group. DOI: 10.13140/RG.2.2.12894.61762. https://www.researchgate.net/publication/376206696_Global_Large_Language_Model_EQ_and_IQ_Bias_Evaluation_-Released_by_DIKWP_-AC_Research_Group.

段玉聪 教授

l DIKWP-AC人工意识（全球）团队发起人

l AGI-AIGC-GPT评测DIKWP（全球）实验室创办者

l 世界人工意识大会发起人（Artificial Consciousness 2023, AC2023, AC2024)

l 国际数据、信息、知识、智慧大会发起人（IEEE DIKW 2021、2022、2023）

l 斯坦福全球顶尖科学家“终身科学影响力排行榜”（海南信息技术）唯一入选

l 海南人工智能技术发明领域唯一全国奖（吴文俊人工智能奖）获得者

l 中国创新方法大赛总决赛（海南代表队）最好记录保持者

l 海南省发明专利（信息技术领域）授权量最多者

l 全国企业创新增效大赛海南最好成绩保持者

l 全国人工智能应用场景创新挑战赛总决赛海南最好成绩保持者

l 海南唯一入选“首届科技期刊高质量发展大会100篇”

l 海南省最美科技工作者（并入选全国候选人）

l 首届中国“AI+”创新创业大赛最佳创意奖

段玉聪教授，海南大学计算机科学与技术学院的教授，博士生导师，第一批入选海南省南海名家计划、海南省领军人才，2006年毕业于中国科学院软件研究所，先后在清华大学、首都医科大学、韩国浦项工科大学、法国国家科学院、捷克布拉格查理大学、意大利米兰比克卡大学、美国密苏里州立大学等工作与访学。现任海南大学计算机科学与技术学院学术委员会委员、海南大学数据、信息、知识、智慧、意图DIKWP创新团队负责人、兼北京信用学会高级顾问、重庆警察学院特聘研究员、海南省委双百人才团队负责人、海南省发明协会副会长、海南省知识产权协会副会长、海南省低碳经济发展促进会副会长、海南省农产品加工企业协会副会长、美国中密西根大学客座研究员及意大利摩德纳大学的博士指导委员会委员等职务。自2012年作为D类人才引进海南大学以来，累计发表论文260余篇，SCI收录120余次，ESI高被引11篇,引用统计超过4300次。面向多行业、多领域设计了241件（含15件PCT发明专利）系列化中国国家及国际发明专利，已获授权第1发明人中国国家发明专利及国际发明专利共85件。2020年获吴文俊人工智能技术发明三等奖；2021年作为程序委员会主席独立发起首届国际数据、信息、知识与智慧大会-IEEE DIKW 2021；2022年担任IEEE DIKW 2022大会指导委员会主席；2023年担任IEEE DIKW 2023大会主席；2022年获评海南省最美科技工作者（并被推全国）；2022年与2023年连续入选美国斯坦福大学发布的全球前2%顶尖科学家的“终身科学影响力排行榜”榜单。参与研制IEEE金融知识图谱国际标准2项、行业知识图谱标准4项。2023年发起并共同举办首届世界人工意识大会（Artificial Consciousness 2023, AC2023)。

段玉聪 教授（Prof. Yucong Duan）

DIKWP人工意识实验室

AGI-AIGC-GPT评测DIKWP（全球）实验室

世界人工意识协会

duanyucong@hotmail.com

第二届世界人工意识大会(AC2024)期待您的加入

http://yucongduan.org/DIKWP-AC/2024/#/

段玉聪 教授（Prof. Yucong Duan）

DIKWP人工意识实验室

AGI-AIGC-GPT评测DIKWP（全球）实验室

转载本文请联系原作者获取授权，同时请注明本文来自段玉聪科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3429562-1428583.html

上一篇：超越算法偏见实现DIKWP全方位偏见管理
下一篇：人工智能DIKWP国际测评标准国际委员会第1次会议纪要 -(征集意见草稿20240406团队版本)

收藏 IP: 140.240.41.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

段玉聪

扫一扫，分享此博文

YucongDuan的个人博客分享 http://blog.sciencenet.cn/u/YucongDuan

博文

人工智能DIKWP国际测评标准 -(征集意见草稿20240406团队版本)

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

段玉聪

全部作者的其他最新博文

全部精选博文导读

YucongDuan的个人博客分享 http://blog.sciencenet.cn/u/YucongDuan

博文

人工智能DIKWP国际测评标准 -(征集意见草稿20240406团队版本)

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

段玉聪

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)