基于收益风险优化属性约简的聚类分析研究

被引量 : 3次 | 上传用户：zebra4th

【摘要】

：

粗糙集是由Z. Pawlak教授提出的一种处理不协调、不确定和不精确数据的数学工具，通过知识约简在保持等价关系的基础上可以产生决策或分类规则，已广泛应用到知识获取、决策分析

【作者】

：

徐节龙

【发表日期】

：

2014年01期

【关键词】

：

粗糙集属性约简决策风险收益聚类分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

粗糙集是由Z. Pawlak教授提出的一种处理不协调、不确定和不精确数据的数学工具，通过知识约简在保持等价关系的基础上可以产生决策或分类规则，已广泛应用到知识获取、决策分析、智能控制、模式识别、机器学习和数据挖掘等领域。决策表属性约简理论是粗糙集的重要组成部分，通常情况下，属性约简可以理解为是在保证不影响信息系统分类能力的情况下，通过删除其中一些冗余的属性和属性值，即用尽可能少的属性表示原有的知识。如何获得快速有效的属性约简算法已成为知识约简领域的一个重要研究内容。聚类又称为无监督分类，能够识别数据的内在结构，目前已被广泛应用于各种数据分析场合，包括计算机视觉分析、统计分析、图像处理、医疗信息处理、生物科学、社会科学和心理科学等。很多聚类分析方法都需要事先给出聚类所需的一些参数，譬如聚类的数目、聚类的中心点和需要迭代的次数等。若事先无法获取这些相关的知识和经验，这些聚类分析算法往往是不可行的。因此，研究一种不需要先验知识、人为因素干扰性小、聚类结果较为准备的聚类算法具有现实的研究意义。本文首先从粗糙集的基本理论入手，介绍了知识约简的启发式约简算法，之后给出了风险最小化的贝叶斯决策和三枝决策粗糙集的基本理论，并延伸到对三枝决策粗糙集正域约简算法的研究。其次，提出了基于风险收益优化的属性约简概念和相应的算法。再次，在基于风险收益优化属性约简的基础上探讨了针对面向信息系统的聚类分析的算法。本文主要研究属性约简和聚类分析算法，具体有以下几方面的内容：1）针对经典粗糙集理论和相关知识约简领域方面的研究，本文首先引入了粗糙集和知识约简的相关概念和定义，然后列举了基于属性重要度的属性约简算法，该算法可以很好地应用于噪音较低的信息系统中。2）针对经典粗糙集属性约简的不足，即在实际应用中由于噪声的存在，通常很难做到误分类率为零的精确分类，将正域定义为完全包含于目标概念的等价类过于严格，缺乏对误分类的容忍能力。本文介绍了风险最小化的贝叶斯决策和决策粗糙集模型，并在此基础上提出了基于决策粗糙集模型的正域约简并给出相关的约简算法。3）在工农业生产、经济活动和社会生活中，决策者总是希望获得的收益最大而承担的风险最小，但是这是一种理想的期望，一般不可能实现的。因此，如何平衡或兼顾两者，寻找切实可行的约简是决策过程中的一个重要问题，通过属性约简可以在海量的、复杂数据中挖掘其中隐藏的属性间关联，从而简化数据模型并提高其系统模型的仿真精度。本文在一定的预期收益水平下通过组合优化收益和风险，建立了收益和风险平衡组合的决策模型，并给出了该模型属性约简的启发式搜索算法。该算法以每个属性的收益风险平衡组合函数作为指标进行启发式属性约简，实例分析和实验表明基于收益和风险优化的约简算法可以缩少数据模型的规模和复杂度，便于进行模型系统的计算机仿真，具有较强的实用性和经济价值。4）针对传统的聚类分析方法需要给出先验知识的局限性，本文提出了一种基于收益风险优化属性约简的聚类分析方法，首先利用面向粗糙集信息系统的聚类算法框架得到一个小粒度的聚类结果；然后提出基于收益风险优化属性约简的聚类算法，该算法使用收益风险优化的函数来指导合并过程，采用凝聚的形式得到一个合适的聚类结果，并对聚类过程进行评估，直到满足聚类算法的终止条件；最后，实例分析和实验表明该聚类算法是有效的。总之，本文针对粗糙集的属性约简、决策粗糙集的正域约简、收益风险优化的约简及其在聚类分析中的应用这几个研究领域，提出了一些相关的属性约简和聚类方法，进一步丰富了属性约简和聚类分析理论。

其他文献

高考职能与高考功能关系研究

在辨析职能与功能、考试职能与考试功能的基础上，明确了高考职能与高考功能的内涵、关系以及研究的切入点。首先，围绕着高考科目设置和基于会考基础之上的高考改革，梳理高考结构

学位

高考高考职能高考功能关系环境

天线外场方向图自动测试系统

设计并实现了基于LabVIEW的天线外场自动测试系统,该系统改变了原有的手动天线测试方式,实现了测试天线与伺服系统的自动控制,能对天线转角、频率、功率等各项测试参数进行自

期刊

接收天线外场测试系统天线方向图

音乐的体裁

体裁———作品的存在形式。(文学体裁:诗歌、小说、散文等;音乐的体裁:交响曲、协奏曲、奏鸣曲等。)现把音乐众体裁分为两大类:声乐体裁、器乐体裁。 Genre - the existent

期刊

器乐体裁奏鸣曲协奏曲声乐体裁声乐套曲交响曲室内乐咏叹调宣叙调康塔塔存在形式

从携程美食林“蔡澜带你寻味美食”谈高端旅游产品开发

以“携程美食林”推出的“蔡澜带你寻味美食”高端美食旅游产品为例,提出当前高端旅游产品开发重点在于定制化产品设计、稀缺行程安排和全新旅游概念定义。而高端旅游产品开

期刊

高端旅游产品开发重点开发难点开发建设

在意义天际的对话——阿多尼斯和他的朋友们

<正>戴潍娜(下文中简称"戴"):刚听北外师生中阿双语的朗诵,让我一时间似乎产生了某种迷幻错觉。这让我想起,在古阿拉伯的传统里,诗歌被认为是一种诱惑和误途。因而在一个宗教

期刊

阿多尼斯阿拉伯文化阿拉伯国家穆太奈比《古兰经》阿拉伯人

某小学五年级篮球课堂教学设计

优质教学方案的制定，需要广大一线体育教师在《体育与健康课程标准》指导下，根据现有的教学条件，充分发挥主观能动性和创新能力，合理选择教学内容、教学手段，为学生设计一堂实用性

学位

五年级小篮球教学设计

高考博士学位论文研究

高考备受瞩目，高考研究也逐渐兴起，既有专家学者的一家之言，也有报纸媒体的评论报道，还有平民百姓的评头论足。面对这众说纷纭的高考，怎样才能认清目前高考研究的现状，反映高考研究

学位

高考博士学位论文

基于框架语义学的汉英非范畴化研究

语言作为认知过程的产物，能够反映人类对世界的感知、理解而形成的概念结构。而语言非范畴化的产生和发展都与特定的社会和文化有着密切的关系。从框架语义学分析来看，语言能力

学位

框架语义学语言非范畴化认知框架语言表征文化意义变化

农村初中化学实验教学现状调查及对策研究

化学实验是一项能促使学生积极主动地探索并获得化学知识、认识化学现象、解决化学问题的实践活动。学生通过亲自参与和体验化学实验活动，在激发学习化学兴趣，增进化学情感的同

学位

农村初中化学实验教学现状调查对策

基于计算机软件开发的JAVA编程语言研究

伴随着互联网技术的广泛应用,计算机软件开发逐渐受到各行各业的重视,而作为目前计算机编程语言性能最为强大的JAVA,已经成为计算机软件开发不可或缺的关键部分。JAVA在计算

期刊

计算机软件开发JAVA编程语言

基于收益风险优化属性约简的聚类分析研究

与本文相关的学术论文