三支决策及其相关理论研究综述-AET-电子技术应用

三支决策及其相关理论研究综述

2014年微型机与应用第12期

刘保相, 李言, 孙杰

河北联合大学研究生学院，河北唐山

摘要： 三支决策理论是姚一豫等人在粗糙集[1]和决策粗糙集[2]基础上提出的新的决策理论。2012年10月召开的中国粗糙集与软计算会议上，姚一豫教授系统地介绍了三支决策理论的背景、框架、模型及应用。“三支决策理论与应用”[3]标志着三支决策由粗糙集的三个区间的语义解释逐步发展为在一种不确定或不完整信息条件下的决策理论。许多学者研究和拓展了三支决策理论，并将其应用于多个学科领域。2013年在漳州举办的中国rough集与软计算学术会议上还专门开设了三支决策讨论班，来自各地的专家学者讨论了三支决策的研究新进展及其未来的发展方向。三支决策用接受、拒绝和不承诺表示决策的三种类型。与此理论研究的不确定信息的处理相关的理论还有诞生于20世纪20年代、在60年代初迅速发展成一门学科的模式识别理论[4]和1989年我国学者赵克勤首次提出的集对分析理论[5]。

关键词： 三支决策粗糙集集对分析模式识别不确定性

Abstract：

Key words :

　　摘要：三支决策、粗糙集、集对分析以及模式识别理论都是处理模糊和不确定性知识的有效理论。分析三支决策与粗糙集、集对分析、模式识别的相似和想通之处，并将它们相互渗透,为今后三支决策理论的进一步发展和完善奠定理论基础。

　　关键词：三支决策；粗糙集；集对分析；模式识别；不确定性

　　三支决策理论是姚一豫等人在粗糙集[1]和决策粗糙集[2]基础上提出的新的决策理论。2012年10月召开的中国粗糙集与软计算会议上，姚一豫教授系统地介绍了三支决策理论的背景、框架、模型及应用。“三支决策理论与应用”[3]标志着三支决策由粗糙集的三个区间的语义解释逐步发展为在一种不确定或不完整信息条件下的决策理论。许多学者研究和拓展了三支决策理论，并将其应用于多个学科领域。2013年在漳州举办的中国rough集与软计算学术会议上还专门开设了三支决策讨论班，来自各地的专家学者讨论了三支决策的研究新进展及其未来的发展方向。三支决策用接受、拒绝和不承诺表示决策的三种类型。与此理论研究的不确定信息的处理相关的理论还有诞生于20世纪20年代、在60年代初迅速发展成一门学科的模式识别理论[4]和1989年我国学者赵克勤首次提出的集对分析理论[5]。模式识别过程是从样本空间到类别空间的一个映射过程，也就是将观察目标与已有模式相比较、配准，判断其类属的过程。集对分析是以集对及其联系度的基本概念，刻画和研究系统中广泛存在着的确定性与不确定性及其转化规律的一种系统分析技术。本文针对三支决策、粗糙集、集对分析、模式识别4种理论的基本思想、对确定性和不确定性的处理、已有的研究方向、应用领域几个方面进行综述，总结和展望三支决策理论与其他理论可以相互借鉴、相互渗透的地方。

　　1 基本思想

　　1.1 粗糙集

　　三支决策最初的提出是为了对粗糙集的3个区间给出一个合理的语义解释。因此首先介绍粗糙集的基本思想。

　　给定一个知识库K=(U,R)，其中R为U上的一个等价关系。如果某个实体X可以用一些R基本范畴的并表示，则X是R可定义的；如果实体X不能用一些R基本范畴的并表示，则X是R不可定义的。R不可定义集又称作粗糙集。对于无法用一个精确集定义的粗糙集，可以用两个精确集来进行近似定义。同时把这两个精确集称为粗糙集的上近似集和下近似集[2]：

　　下近似：RX=∪{Y∈U/R|Y?哿X}

　　上近似：RX=∪{Y∈U/R|Y∩X≠?椎}

　　其中posR(X)=RX称为X的R正域，negR(X)=U-RX称为X的R负域，bnR(X)=RX-RX称为X的R边界域。根据定义,在知识R划分下,posR(X)中的元素一定属于X；negR(X)中的元素一定不属于X；bnR(X)中的元素不能准确判断是否属于X。

　　定理1：(1)X是R可定义集当且仅当RX=RX;

　　(2)X是R粗糙集当且仅当RX≠RX。

　　1.2 三支决策

　　三支决策理论的基本思想是在实体评价函数上引入两个阈值，并构造所需要的3个域。设U是有限、非空实体集或者决策方案集；C是有限条件集，条件集可能包含指标、目标或约束。决策任务是基于给定条件对每一个实体x∈U作出相应决策。条件集C给出了决策的依据，通过构造评价函数给出决策。当信息不确定或者不完整时，可能无法确定实体是否属于满足条件，也就是评价函数是对实体满足条件的一种估计而非精确值。由于这种估计的不确定性，采用二值决策可能比较困难，在评价函数值既不很高也不很低时，不论是接受或拒绝都不合理。此时引入三支决策，给定阈值?琢和?茁：

　　(1)当评价函数值大于或等于?琢时，接受该实体；

　　(2)当评价函数值小于或等于?茁时，拒绝该实体；

　　(3)当评价函数值在?琢和?茁之间时，既不拒绝也不接受，选择不承诺决策。

　　在决策中，信息不足或获取信息需要一定代价时，可以给出接受、拒绝和不承诺的三支决策-粗糙集是典型的三支决策模型，粗糙集模型的正域、负域和边界域可以解释为接受、拒绝和不承诺三种决策的结果。

　　1.3 集对分析

　　集对是具有一定联系的两个集合组成的对子。集对分析的核心思想是把确定不确定视作一个确定-不确定系统，在这个系统中确定性与不确定性相互联系、相互影响、相互制约，并在一定条件下相互转换，确定与不确定性关系用同异反联系度来描述。

　　给定两个集合A和B，并设这两个集合组成集对，表示为H=(A,B),在某个具体的问题(记为W)背景下，对集对H的特性展开分析，共得到N个特性，其中有S个为集对H中两个集合A和B共同具有；在P个特性上集合A和B相对立；在其余的F=N-S-P个特性上既不相互对立，又不为这两个集合所共同具有，则称比值：S/N为这两个集合在问题W下的同一度；F/N为这两个集合在问题W下的差异度；P/N为这两个集合在问题W下的对立度；并用下式加以统一表示。

%NYTY)AS~65NW{YK~548%)Y.jpg

　　模式是指通过观察可以区别其相同与否的事物。将所要观察的目标与已经存在的模式进行比较、配准并判断其类属的过程是模式识别的过程。模式识别的过程是人类认知、判别的过程，在人类活动中占有非常重要的地位。随着计算机科学的发展，人们逐渐可以借助计算机来实现模拟人的模式识别过程[6-7]。虽然使用模式识别的主体不同，但原理基本相同，都是将要观察的目标与已经存在的模式进行配比分析。

　　模式识别使用的方法因源数据类型不同而相应不同，但最终目标都是将样本归类到相似程度最大的标本类里。模式识别的基本步骤有:信息预处理、特征提取和选择、分类决策。常见的模式识别方法[8]如表1所示。

　　三支决策是决策粗糙集的语义扩展[1]，粗糙集中的正域、负域、边界域与集对分析的同异反联系度可以互相转换[5]，而模式识别理论涉及的识别和判别决策可以使用粗糙集和三支决策的原理进行分析决策。

　　2 确定性和不确定性

　　从哲学的观点看，不确定是相对于确定而言的，没有了确定也就没有了不确定，反之亦然。

　　粗糙集的不确定性体现在：当X不能用R基本范畴的并表示时，则X是R不可定义的。但却可以使用两个精确集将不可定义集进行近似定义。由这两个精确集作差得到的边界域是粗糙集粗糙程度的体现。等价关系R的划分越细，边界域中能被划分到正域或负域的部分越多，边界越清晰，集合的粗糙程度越小；等价关系R的划分越粗糙，边界越粗糙，集合的粗糙程度也越大。

　　三支决策的不确定性与粗糙集类似。粗糙集的正域、负域和边界域可以解释为接受、拒绝和不承诺的三种决策的结果。当无法使用接受或拒绝规则时，采取不承诺决策。已知的信息越充分，接受和拒绝决策的可能性越大，不承诺决策的可能性就越小；已知信息越少，接受和拒绝决策的可能性越小,不承诺决策的可能性就越大。

　　而集对分析对不确定的态度是客观承认、系统描述、定量刻画、具体分析。具体体现在首先集对分析对不确定性采取“客观承认”的态度；其次把事物的确定性和不确定性作为一个系统来加以处理, u=a+bi+cj, i∈[-1,1],a+b+c=1；再次对确定不确定系统作同异反定量描述；最后对不确定系数i根据不同情况作不同的取值。对集合的特征提取越多，能确定的相同或相反的属性越多，相异属性越少，联系度的量化更精确；特征提取越少，能确定的相同或相反的属性越少，相异属性越多，联系度的量化更粗糙。

　　而模式识别过程中重要的一点是特征选择和提取。特征选择越多，对事物的了解越清晰，归类正确的可能性越大；特征选择越少，对事物的了解越模糊，归类正确的可能性越小。

　　4种理论中不确定性的程度都依赖于所掌握的“知识”的程度。

　　3 研究方向

　　对粗糙集、三支决策、集对分析、模式识别现有研究方向的探析便于找出它们相互交融的地方，同时避免科研工作的重复。

　　粗糙集模型扩展是粗糙集理论研究的一个重要方向。经典粗糙集是基于等价关系划分数据的，进一步研究非等价关系，得到了“基于非等价关系的邻域粗糙集模型”；同时扩展划分概念得到“基于粒的扩展粗糙集模型”；对粗糙集中近似算子扩展得到基于子系统的扩展模型；进一步研究基于统计信息的概率粗糙集模型，如0.5-概率粗糙集模型、可变精度粗糙集模型、参数化粗糙集模型和贝叶斯粗糙集模型。这些方面常常不是单独出现，还可以进行交叉、综合。

　　三支决策理论已经进行了的工作是对理论的完善，如用博弈粗糙集模型给出了决策阈值的选取方法；将三支决策应用于代价敏感问题分类、半监督学习、政策分析等具体问题中；同时还研究了决策粗糙集下的三支决策理论和应用以及双论域决策粗糙集的理论和应用。

　　集对分析是非常年轻的学科，目前的研究着重于对其数学性质探析、对联系度有效性的改进、与其他不确定性方法的关系和互补。最终目的是使集对分析表示的确定和不确定性的联系更客观、更有效。

　　模式识别理论和方法的研究主要集中在研究生物体如何感知对象以及研究如何用计算机实现模式识别这两个方面。在数学上，选择合适的判别函数和分类器是值得长期思考的问题。常见的模式识别方法如：模板匹配、统计模式识别、句法（结构）模式识别、模糊模式识别、人工神经元网络模式识别。

　　将论域进行扩展，将确定与不确定进行对比分析，使决策更具客观有效性是研究的热点。

　　4 应用领域

　　粗糙集在知识获取(如数据预处理、属性约简、规则生成、数据依赖关系获取)上有成功的应用；知识的不确定性度量也是其应用的重要方面；还有面向领域的数据驱动的数据挖掘、海量数据挖掘；而在计算机领域常见的应用是基于数据的决策与分析、机器学习、模式识别等。

　　三支决策理论的提出是基于决策粗糙集模型，但也可用于传统粗糙集模型、博弈粗糙集模型和构造性神经网络，还可用于分类、聚类、规则学习等数据分析模型。

　　集对分析主要用于决策、预测、数据融合、不确定性推理、产品设计、网络计划、综合评价等。

　　模式识别主要应用在数据挖掘、文献分类、财政预测、多媒体数据库的组织和检索、生物（人脸、指纹识别）、医学（医学图像分析）、地质、能源、气象（天气预报）、化工、冶金、航空、工业产品检测中。

　　在不确定信息下有分类和决策的地方正是这4种理论大展身手的地方。

　　研究后发现了一个有趣的现象——将粗糙集、三支决策、集对分析、模式识别进行对比分析的过程恰恰是这4种理论都存在的经典的对比分析的过程。这些研究和应用各具特色，又互有交叉。正所谓站在巨人的肩膀上才能望得更远，对已有知识对比分析的需求无处不在，也正是这种需求才推动了它们之间相互借鉴、相互促进，科学理论才能发展得更快更完善。

　　参考文献

　　[1] 张文修, 吴伟志, 梁吉业，等.粗糙集理论与方法[M].北京：科学出版社, 2001.

　　[2] YAO Y Y, WONG S K M, LINGRAS P. A decision-theoretic rough set model[C]. The 5th International Sympo-sium on Methodologies for Intelligent Systems,1990.

　　[3] 贾修一,商林等.三支决策理论与应用[M].南京:南京大学出版社,2012.

　　[4] 孙亮,禹晶.模式识别原理[M].北京：北京工业大学出版社,2009.

　　[5] 赵克勤.集对分析及其初步应用[M].杭州：浙江科学技术出版社,2000.

　　[6] 王敏妲.语音识别技术的研究与发展[J].微型机与应用,2009,28(23):1-6.

　　[7] 童刚,朱鸿博.图像处理在红绿灯判别中的应用[J].微型机与应用,2013,32(4):88-90.

　　[8] 蒋云良,徐从富.集对分析理论及其应用研究进展[J].计算机科学,2006,33(1):205-209.

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容