引用本文
高满, 张清华, 王国胤, 姚一豫. 针对模糊数据近似处理的阴影集研究综述. 自动化学报, 2024, 50(10): 1906−1927 doi: 10.16383/j.aas.c230808
Gao Man, Zhang Qing-Hua, Wang Guo-Yin, Yao Yi-Yu. Review of shadowed set for fuzzy data approximation processing. Acta Automatica Sinica, 2024, 50(10): 1906−1927 doi: 10.16383/j.aas.c230808
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c230808
关键词
阴影集,模糊集,三支决策,不确定性,粒计算
摘要
阴影集(Shadowed set, SS)是一种对模糊集进行三支近似处理的不确定性知识发现模型, 其能够对模糊集中具有精确值的不确定性对象进行有效的近似和划分, 从而减少模糊决策过程中不确定性对象的决策划分成本和计算损耗. 首先, 回顾阴影集的发展历程, 并从四个方面介绍其研究现状及内容, 即阴影集的模型构建、理论性质、数据分析以及应用研究. 通过总结分析它们的核心思想、方法体系、相互关系和区别等, 为该领域的后续研究提供借鉴. 随后, 讨论分析阴影集理论与其他不确定性问题处理理论模型的联系, 尤其是阴影集与模糊集、粗糙集和三支决策理论之间的区别、联系以及互补性. 最后, 围绕上述四个研究方面, 对当前若干具有挑战性的研究问题进行分析和展望.
文章导读
当前智能信息时代, 数据体量高速增长, 数据特性纷繁复杂. 如何从大数据中去粗取精、去伪存真地挖掘出有效的知识是数据挖掘领域所关注的关键问题. 而如何从海量的具有不确定性的数据信息中挖掘和提炼出确定性的知识则是知识发现领域和认知科学领域所关注的关键问题. 因此, 对于不确定性信息的转化和处理的研究就受到了诸多学者的关注. 基于此, 1965年, Zadeh[1]提出模糊集(Fuzzy sets) 理论, 其能够有效地刻画和处理不确定性信息. Zadeh[1]认为任一对象总在一定程度上属于某一个集合或目标概念, 也可以在不同程度上属于多个集合或目标概念. 因此, 其给出了“隶属度”的定义, 通过在有限非空论域U={x1,x2,⋯,xn}上给定一个映射函数μA:U→[0,1], x→μA(x)来描述一个对象x隶属于某一目标概念的程度, 称A为U上的一个模糊集, 称μA(x)为A的隶属度函数, 其表示对象x隶属于A的程度, 其中0≤μA(x)≤1. 然而, 精确的隶属度值就像是一把双刃剑. 虽然模糊集能够通过隶属度函数和精确的隶属度值来有效地刻画一个模糊性概念, 但是对于部分隶属度差距非常小的对象, 有时无需进行严格区分, 即对于一般目标概念的刻画和描述并不总是需要完全精确的隶属度, 反而可以通过一些特定值来表示那些非常相似的对象. 这与人类习惯通过已有知识来近似刻画未知事物的认知思想相类似. 此外, 较高的精度需求也伴随着巨大的计算损耗, 这在模糊集数据体量较大时尤其明显, 也极大地影响了模糊集理论的应用[2].
为解决上述问题, Pedrycz[2]提出阴影集(Shadowed set, SS)理论: 一种针对模糊信息数据分析的三支近似表达模型. 它可以有效地对模糊集中具有精确值的不确定性对象进行近似表达, 从而减少模糊决策过程中不确定性对象的决策划分成本和计算损耗. 如对于信息检索问题, 可以通过一对给定的近似划分阈值过滤掉大量与检索目标无关的记录, 以快速响应模糊查询的需求[2]. 而阴影集的核心思想便是通过一对决策阈值(α,β)(0≤β<α≤1)将模糊集A中具有不确定性的对象x划分到三个互不相交的区域, 即提升域(μA(x)≥α)、减小域(μA(x)≤β)和阴影域(β<μA(x)<α). 其中这三个区域分别用常数值1、0以及区间值[0,1]来表示, μA(xi)表示对象xi隶属于模糊集A, 即目标概念的程度. 阴影集通过这种不太精确的、粗糙的三支近似表达形式替换掉原模糊集中精确值的表达形式, 这有效减少了模糊集中的冗余信息, 即可以理解为一种针对精确值数据信息的粒化处理手段, 这也使得阴影集相比模糊集在处理不确定性信息时更加简洁和高效.
由于阴影集在不确定性信息处理过程中所表现出来的简单性和有效性, 使其吸引了大量学者展开研究, 并将其应用到诸多领域. 对此, 本文通过梳理当前研究现状, 将围绕阴影集所展开的研究工作归纳为四个方面, 如图1所示, 即: 1) 阴影集的模型构建; 2) 阴影集的理论性质; 3) 阴影集的数据分析; 4) 阴影集的应用研究. 其中, 在阴影集的模型构建方面, 主要关注: 1) 阴影集的表达形式, 尤其是阴影域的表示; 2) 决策阈值对(α,β)(α,β)的求取方法和语义解释. 在阴影集的理论性质方面, 主要关注: 1) 基于阴影集的模糊关系、结构解释、逻辑运算或数学性质等; 2) 基于不同模糊集下的阴影集构建分析. 在阴影集的数据分析方面, 主要关注: 1) 基于阴影集的聚类/分类算法; 2) 基于阴影集的数据预处理. 在阴影集的应用研究方面, 主要关注: 1) 图像分类和识别; 2) 医疗信息处理; 3) 文本分析; 4) 决策推荐.
图 1 阴影集研究的四个主要方面
本文的研究贡献总结如下: 1) 梳理了阴影集模型的历史发展脉络, 总结了不同阴影集模型之间的区别和联系, 介绍了不同模型的核心思想和构建步骤; 2) 按类别和时间对当前阴影集在各个方面的研究现状以及不同研究工作之间的递进关系进行了分析和总结; 3) 分析了阴影集与其他不确定性问题处理理论之间的联系, 尤其是相关联的模糊集、粗糙集以及三支决策理论, 并通过应用实例分析了其相互之间的互补性; 4) 深入分析了当前阴影集研究领域中所存在的挑战性问题, 以及潜在的研究方向和可能的研究思路. 本文的逻辑性研究框图如图2所示.
图 2 研究框图
图 3 阴影集的几种三支近似表达形式
阴影集在不确定性信息处理过程中所表现出的简单性和有效性使其受到了大量学者的关注. 本文从四个方面对阴影集的研究工作进行了总结和分析: 在模型构建方面, 介绍了不同阴影集的核心思想、方法体系及模型差异, 如表1所示; 在理论性质方面, 介绍了基于阴影集的模糊关系、结构解释、逻辑运算或数学性质等研究, 以及基于不同模糊集的阴影集构建研究, 如表5和表6所示; 在数据分析方面, 介绍了基于阴影集的聚类、分类算法以及数据预处理研究, 如表7所示; 在应用研究方面, 介绍了基于阴影集的图像分类与识别、医疗信息处理、文本分析和决策推荐研究, 如表8 所示. 此外, 还讨论分析了阴影集与粗糙集、模糊集和三支决策等处理不确定性问题的理论模型之间的联系、区别及互补性. 最后, 分析了当前所存在的若干挑战性问题, 即, 如何将阴影集的构建考虑从单准则约束推广到多准则约束; 如何从单粒度(单粒层)空间推广到多粒度(多粒层)空间; 如何从静态数据空间推广到动态或增量数据空间; 如何定义不同阴影集模型之间的运算算子、运算规则, 并挖掘其中的运算性质; 如何结合模糊集运算算子的考虑设计不同类型的阴影集运算算子; 如何以数据分析或实际应用任务为导向来构造阴影集模型的目标函数. 本文工作将为关注粒计算、不确定性问题处理和知识发现领域的研究者提供一些理论参考, 并促进阴影集的不断发展完善和推广应用.
作者简介
高满
重庆邮电大学计算机科学与技术学院博士研究生. 主要研究方向为粒计算, 三支决策和不确定性信息处理. E-mail: d200201005@stu.cqupt.edu.cn
张清华
重庆邮电大学计算机科学与技术学院教授. 主要研究方向为粒计算, 不确定性信息处理和大数据智能. 本文通信作者. E-mail: zhangqh@cqupt.edu.cn
王国胤
重庆师范大学重庆国家应用数学中心教授. 主要研究方向为粒计算, 认知计算和智能信息处理. E-mail: wanggy@cqupt.edu.cn
姚一豫
里贾纳大学计算机科学系教授. 主要研究方向为三支决策, 粒计算和不确定性信息处理. E-mail: Yiyu.Yao@uregina.ca
转载本文请联系原作者获取授权,同时请注明本文来自欧彦科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3291369-1460176.html?mobile=1
收藏