基于 DIKWP(数据、信息、知识、智慧、目的)框架来数学化定义智能
段玉聪
人工智能DIKWP测评国际标准委员会-主任
世界人工意识大会-主席
世界人工意识协会-理事长
(联系邮箱:duanyucong@hotmail.com)
1. DIKWP 各层次的数学表示数据 (Data, $D$):数据层可以形式化为原始符号或测量值的集合。例如,用集合$\mathcal{D}$表示所有数据点,每个数据点 $d \in \mathcal{D}$ 是对客观世界的某种记录(数字、符号等)。数学上常将数据描述为一个集合或向量空间,如$\mathcal{D}={d_i}$,其中 $d_i$ 是具体的数据实例向量 (Modeling and Resolving Uncertainty in DIKWP Model)。数据本身缺乏语义,仅包含原始事实。
信息 (Information, $I$):信息层是对数据进行组织和赋义后的结果。可将信息形式化为带结构和上下文的数据。例如定义一个映射 $T_{D\to I}$ 将数据转换为信息:
TD→I:D×C→I,T_{D\to I}: \mathcal{D} \times \mathcal{C} \to \mathcal{I},
其中 $\mathcal{C}$表示上下文或语境,$\mathcal{I}$表示信息集合。对于给定数据 $d$ 和背景知识/上下文 $c$,有 $i = T_{D\to I}(d,c)$ 表示从数据提取出语义信息 $i$。如果上下文固定不变,也可简写为 $i = T_{D\to I}(d)$。信息可以用元组表示,例如 $i=(d,\text{语义结构})$,表示对数据施加了一定的解释或模式识别得到的结构化结果。直观地,信息是赋予意义的数据 (Applied Sciences | Special Issue : Purpose-Driven Data–Information–Knowledge–Wisdom (DIKWP)-Based Artificial General Intelligence Models and Applications)。
知识 (Knowledge, $K$):知识层是对信息的总结和泛化。可将知识表示为信息及其之间关系的集合,通常以规则、命题或网络形式出现。数学上,可以定义知识空间 $\mathcal{K}$ 由一组命题或规则组成,它是信息经过学习或推理后的可泛化认知。例如,通过映射 $T_{I\to K}$ 表示信息到知识的转换:
TI→K:In→K,T_{I\to K}: \mathcal{I}^n \to \mathcal{K},
其中$\mathcal{I}^n$表示可能需要综合多个信息项。知识可以表示为$(S, R)$,其中 $S$ 是知识命题的集合,$R$ 是推理规则的集合;或者等价地,用逻辑形式$\langle \text{前提} \vdash \text{结论}\rangle$来描述知识从已知信息推导新信息的能力。知识的形成可视为对信息的抽象与概括 (Applied Sciences | Special Issue : Purpose-Driven Data–Information–Knowledge–Wisdom (DIKWP)-Based Artificial General Intelligence Models and Applications)。例如,若信息层包含若干观测事实,知识层可能通过模式发现形成“一般规律”或构建知识图谱来表示实体及关系。
智慧 (Wisdom, $W$):智慧层是能够良好地应用知识解决问题和决策的能力。可将智慧形式化为在给定目的下选择和运用知识的过程。数学上,定义映射 $T_{K\to W}$ 表示由知识得到智慧决策:
TK→W:K×P→W,T_{K\to W}: \mathcal{K} \times \mathcal{P} \to \mathcal{W},
其中 $\mathcal{P}$ 是目的空间(后述),$\mathcal{W}$ 是智慧/决策空间。对于知识库 $k\in\mathcal{K}$ 和当前目的 $p\in\mathcal{P}$,有 $w = T_{K\to W}(k,p)$,其中 $w$ 可理解为一项决策、方案或对策。换言之,智慧体现为在情境和目的引导下,筛选相关知识并付诸行动的能力。例如,给定知识库和目标,智慧函数 $T_{K\to W}$ 可以通过优化某种效用函数(由目的定义)从知识库中选出最合适的行动方案(如 $w=\arg\max_{a\in \mathcal{W}} U_p(a)$,其中 $U_p$ 是针对目的$p$的效用评价)。智慧层结合经验和价值判断,使知识在决策中得到恰当应用 (Applied Sciences | Special Issue : Purpose-Driven Data–Information–Knowledge–Wisdom (DIKWP)-Based Artificial General Intelligence Models and Applications) (Applied Sciences | Special Issue : Purpose-Driven Data–Information–Knowledge–Wisdom (DIKWP)-Based Artificial General Intelligence Models and Applications)。
目的 (Purpose, $P$):目的层代表智能体试图达到的目标、意图或价值标准。数学上,可将目的表示为目标函数或约束条件。例如,将目的定义为一个评价函数或目标状态集合:$p\in\mathcal{P}$ 可以定义为 $U_p: \mathcal{W} \to \mathbb{R}$,对智慧层输出的决策进行评分;或者定义为一组理想目标状态 $\Omega_p \subseteq \Omega$($\Omega$为可能的世界状态空间),智能体力求使结果落入$\Omega_p$。目的在DIKWP框架中提供了方向和评价标准,使得知识的获取和应用有了终极参照。目的层强调了知识转换和应用必须服务于特定目标 (Applied Sciences | Special Issue : Purpose-Driven Data–Information–Knowledge–Wisdom (DIKWP)-Based Artificial General Intelligence Models and Applications)。与传统DIKW模型相比,增加“目的”意味着在分析数据到智慧的过程时,将“为何做”作为内在组成部分。形式上虽然目的可视为输入参数而非由下层推导出的状态,但在扩展模型中也可将目的视作最高层的语义内容,用于指导其他层次的处理和相互转化。
每一层之间的关系通过上述映射函数 $T_{D\to I}$、$T_{I\to K}$、$T_{K\to W}$ 等加以联结。这些函数刻画了DIKWP各层内部语义的相互转换。需要注意的是,这些转换通常依赖上下文和目的的指导。例如,在数据转信息时应用“注意力”聚焦于与当前目的相关的数据特征 ((PDF) Mathematical DIKWP Model through Cognitive Function Modeling);在知识转智慧时,明确考虑了目的$p$来筛选知识。由此,DIKWP框架内涵一种分层结构:数据是最原始的层次,逐步上升经过信息、知识达到智慧,每一层抽象程度和价值密度逐渐提高,同时“目的”贯穿始终提供方向。
2. 智能的整体数学模型(基于 DIKWP)基于上述DIKWP层次,我们可以构建一个智能体的整体数学模型,仅用各层的交互和转换来刻画智能的计算过程。智能体可以建模为包含五元组 $(D, I, K, W, P)$ 及其转换函数的一组系统:
状态表示:智能体在任一时刻具有数据状态$d\in\mathcal{D}$(感知或输入获取的原始数据),信息状态$i\in\mathcal{I}$,知识状态$k\in\mathcal{K}$,智慧决策$w\in\mathcal{W}$,以及目标$ p\in\mathcal{P}$(由任务要求或智能体自身设定的目的)。这些并非独立,而是通过转换函数联系。
层间转换:智能体从数据到智慧的推理过程分为三级转换,再结合目的形成闭环:
数据→信息:$i = T_{D\to I}(d,;p)$ 将原始数据 $d$ 转化为有意义的信息 $i$。这里明确写出 $p$,表示在目的驱动的情形下,信息提取会关注与目标相关的特征(例如在导航任务中,只从传感器数据中提取与路径相关的信息)。
信息→知识:$k = T_{I\to K}(k_{\text{旧}},;i)$ 将新的信息融入先前的知识库,形成更新的知识 $k$。这可以表示为一个递归或累积过程:给定当前知识状态 $k_{\text{旧}}$ 和新得到的信息 $i$,智能体应用学习或推理机制 $T_{I\to K}$ 更新知识。若是初始阶段没有先验知识,可令$k_{\text{旧}}$为空集。$T_{I\to K}$ 可以视为一种学习函数或归纳函数,将信息的集合映射为更一般化的知识(例如,通过归纳推理得到规则,或者更新概率模型的参数)。
知识→智慧:$w = T_{K\to W}(k,;p)$ 利用当前知识 $k$ 产生智慧决策 $w$,该决策旨在实现目标 $p$。这里的 $T_{K\to W}$ 可以视为决策函数:在知识的支持下,选择能够最好满足目的的行动或方案$w$。形式上,$T_{K\to W}$ 完成一种优化或推理:w=argmaxa∈WF(k, a, p),w = \arg\max_{a \in \mathcal{W}} F(k,\;a,\;p),其中 $F$ 是根据知识$k$评估候选行动$a$对目标$p$效果的评估函数(例如根据知识预测行动结果,再用目标函数评分)。这一过程体现了将知识应用于实践的环节,即智慧层输出具体行动方案或决策。
整体映射:将以上三级串联,可定义智能体从原始数据和目的到智慧决策的总映射 $F$:
F:D×P→W,F(d,p)=TK→W (TI→K (TD→I(d, p)), p).F: \mathcal{D} \times \mathcal{P} \to \mathcal{W}, \qquad F(d,p) = T_{K\to W}\!\Big(T_{I\to K}\!(T_{D\to I}(d,\;p)),\;p\Big).
这个复合函数 $F$ 描述了智能计算的完整流程:给定目标$p$和环境提供的原始数据$d$,智能体经过内部的DIKWP层次转换,最终在智慧层得到针对该目标的决策$w=F(d,p)$。由于目的$p$可能在各阶段影响处理,上式中也可将$T_{I\to K}$写成$T_{I\to K}(k_{\text{旧}}, i, p)$表示学习时侧重与$p$相关的知识领域;同理$T_{D\to I}(d,p)$表示感知数据时在$p$的上下文下提取信息。然而无论显式与否,目的P在整个链条中提供指导信号,确保每级转换所提取/生成的内容与最终目标相关。
反馈与自适应:虽然以上$F$将智能过程描述为一次性的前馈映射,但实际智能体往往是循环自适应的。DIKWP框架支持内部反馈:智慧决策$w$付诸实施后,会影响环境并产生新的数据$d'$(这可看作一个$T_{W\to D}$的反馈函数,将行动的结果反馈为新的数据)。同时,目的$p$本身也可能因智慧层的反思而调整(例如在学习过程中重新评估目标可行性,可抽象出$T_{W\to P}$)。正式地,DIKWP可以构成闭环 ((PDF) Mathematical DIKWP Model through Cognitive Function Modeling):TW→P:W→P,TP→D:P→D,T_{W\to P}: \mathcal{W} \to \mathcal{P}, \qquad T_{P\to D}: \mathcal{P} \to \mathcal{D},使得智慧层的输出可以影响目标的演化,目标又可以指导新的数据获取(如主动感知系统根据任务目标选择探测哪里的数据)。这种相互作用构成了智能体持续改进的循环。但在本题要求的模型中,我们强调逻辑上的纯粹DIKWP转换,为简洁起见主要聚焦$D\to I\to K\to W$在给定目的下得到决策的单步过程。
综上,智能的DIKWP模型通过严格的数学关系将各层次贯通起来:数据提供原始素材,信息是经过语义解释的数据,知识是归纳整合的信息,智慧是在知识支持下针对目的的决策,目的提供评价和方向。整个系统在数学上表现为一系列映射的组合和交互。在不借助外部框架的情况下,我们仅用集合、映射和优化的概念就描述了智能体的核心逻辑架构。这体现了一种分层语义计算模型,智能体被定义为“一个将数据转换为有目的之智慧的数学函数”。该模型也为后续定义智能的度量提供了基础:我们可以定量分析每一步转换的有效性以及最终决策对目的的达成度。
3. 基于 DIKWP 转换的智能度量和评估在DIKWP框架下,我们可以定义智能的数学度量,完全利用内部各层次的转换关系和结构来评估智能体的性能。关键思想是:智能体现为将数据转化为满足目的之智慧的能力,因此可通过各层转换的效果以及最终目的达成度来量化。
(a) 分层转换绩效度量:首先,为DIKWP链中的每个转换定义局部度量,以评估该层转换的有效性:
数据→信息有效性 $Q_{DI}$:衡量智能体从原始数据中提取出有用信息的程度。可以定义:
QDI=提取的信息量数据中蕴含的有效信息量∈[0,1].Q_{DI} = \frac{\text{提取的信息量}}{\text{数据中蕴含的有效信息量}} \in [0,1].
理想情况下,$Q_{DI}=1$ 表示从数据中提取出了全部与当前目的相关的有效信息,未遗漏关键内容且剔除了无关噪声;$Q_{DI}<1$ 表示有信息损失或混入无关内容。虽然严格计算“有效信息量”需要对照客观真值,这里度量的思想是在DIKWP内部检查信息表示对数据的忠实和精炼程度。例如,如果数据$d$包含若干独立事实,而信息表示$i=T_{D\to I}(d)$丢失了一些要点,则$Q_{DI}$会降低。
信息→知识有效性 $Q_{IK}$:衡量智能体将信息综合抽象为知识的程度。可定义:
QIK=知识覆盖的信息信息总量∈[0,1].Q_{IK} = \frac{\text{知识覆盖的信息}}{\text{信息总量}} \in [0,1].
这里“知识覆盖的信息”指通过知识库能够推导或解释的那部分信息。例如,如果知识库$k$包含规则能够解释大部分观察信息,则$Q_{IK}$接近1;若知识片面零散,无法解释已知信息,则$Q_{IK}$偏低。这个度量等价于知识对信息的解释力和泛化度:$Q_{IK}=1$意味着知识充分总结了信息,没有矛盾和遗漏(信息都成为知识的一部分或被知识逻辑涵盖)。形式上,若用$\operatorname{Inf}(k)$表示从知识$k$可推导出的信息集合(知识的推论闭包),则可定义 $Q_{IK} = \frac{|\operatorname{Inf}(k) \cap I_{\text{all}}|}{|I_{\text{all}}|}$,其中 $I_{\text{all}}$是系统已获取的全部信息集合。
知识→智慧有效性 $Q_{KW}$:衡量智能体利用知识实现目的决策的效果。我们可以从决策合理性角度定义:
QKW=成功实现目的的智慧决策数总决策数∈[0,1].Q_{KW} = \frac{\text{成功实现目的的智慧决策数}}{\text{总决策数}} \in [0,1].
在给定知识和目的下,如果智慧函数$T_{K\to W}$总是选出能达成目标的正确行动,则$Q_{KW}=1$;若经常选错(导致未达到目的),则该比值下降。换一种更细致的刻画,$Q_{KW}$ 也反映知识与目标的相关性和决策策略的有效性:智慧层是否选用了恰当的知识子集以及正确的推理,来输出最优决策。如果定义一个评价函数$\mathcal{E}(w,p)$来衡量决策$w$对目的$p$的达成度(例如$\mathcal{E}=1$表示完全达成,0表示失败),那么可以取$Q_{KW} = \mathbb{E}{w \sim T{K\to W}(k,p)}[\mathcal{E}(w,p)]$,表示在知识和目的条件下智慧决策成功的期望概率。
有了以上各局部指标,我们可以定义智能体在一次任务(给定特定 $d$ 和 $p$)中的总体智能绩效 $Q_{\text{total}}$ 为这些指标的综合。例如采用加权乘积或加权和形式。若认为各层转换相互依赖且缺一不可,则可取乘积形式强调“短板效应”:
Qtotal(d,p)=QDI⋅QIK⋅QKW,Q_{\text{total}}(d,p) = Q_{DI} \cdot Q_{IK} \cdot Q_{KW},
该值越接近1,表示从数据到智慧的整个链条都高质量完成,智能体在此情景下表现出高智能;若任一环节低效(接近0),则整体$Q_{\text{total}}$也低。这种分层度量直接基于DIKWP框架内部的结构:它检查每一步的信息转换和利用效率,因而是对智能的内在过程评估。
(b) 目标达成度量:从全局视角,智能的最终目的是在不同情境下实现各种目的的能力。我们可以定义一个基于目的达成的数学度量来评价智能体在广泛任务上的表现。利用前述智能映射 $F(d,p)$,引入一个目的满足度函数 $\mathcal{U}(w,p)$ 来评估决策/行动 $w$ 在目的 $p$ 下的效果,$\mathcal{U}$值域可以是实数或[0,1]区间(1表示完全实现目的,0表示未实现)。那么,对某一特定任务$(d,p)$,智能体输出$w=F(d,p)$的绩效可用$\mathcal{U}(F(d,p),,p)$来表示。进一步地,定义智能体的总体智能度量$\mathcal{M}$为在各种目的和数据分布上的期望表现:
M = Ep∈P, d∈D [ U(F(d,p), p) ] ,\mathcal{M} \;=\; \mathbb{E}_{p\in \mathcal{P},\,d\in \mathcal{D}}\;\big[\,\mathcal{U}(F(d,p),\;p)\,\big]~,
即在所有可能遇到的目的 $p$ 和相应环境数据 $d$ 上,智能体实现目的的平均程度。如果 $\mathcal{P},\mathcal{D}$ 是有限集合,也可用求和平均形式替代期望。这个度量直接体现了目的P在DIKWP框架中的核心作用:智能体若能针对各种目标利用其DIKW机制做出高效决策,其 $\mathcal{M}$ 值就高;若智能体只能在少数特定目的下表现良好(或需要特定数据),则平均下来说 $\mathcal{M}$ 较低。
以上两种度量思路是互补的:(a)通过检查内部各层转换的质量来评估智能,这是面向过程的度量;(b)通过目标达成情况来评估智能,这是面向结果的度量。而两者在DIKWP框架下是一致的:过程良好的智能体才能产生好的结果,而结果成功又反过来印证了过程各层的有效性。值得注意的是,在纯DIKWP表述中,我们未引用经典信息论或控制论公式,而是直接依赖于DIKWP内部的逻辑结构(数据-信息-知识-智慧-目的的关系)来定义指标。例如,上述期望公式本质上利用了目的空间$\mathcal{P}$和数据空间$\mathcal{D}$的遍历性,以及决策相对于目的的评价函数$\mathcal{U}$,这些概念全部源自DIKWP框架自身($\mathcal{P}$体现目的,$\mathcal{D}$提供数据,$\mathcal{U}$评估智慧决策对目的的契合度)。正如相关研究所指出的,在处理目的时,智能体通过学习和适应不断使输出更接近预定目标 (Modeling and Resolving Uncertainty in DIKWP Model)——这恰是$\mathcal{U}(F(d,p),p)$逐步提高的过程。
综上,智能度量可以被数学地定义为:智能 = DIKWP链条在各种目的下成功运作的程度。我们提供了一个严格的公式化方案:利用DIKWP内部转换的性能指标以及最终目的达成的评价,来定义智能的定量标准。这一度量体系能够在不借助外部框架的情况下评估任何基于DIKWP原理的智能体,从而为智能的比较和标准化提供了纯粹的理论依据。
转载本文请联系原作者获取授权,同时请注明本文来自段玉聪科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3429562-1477132.html?mobile=1
收藏