基于邻域粗糙集的模型扩展和算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:sundianjusdyg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是波兰学者Pawlak于1982年提出的一种能够有效进行不确定信息处理的重要数学工具。目前已经大量应用在数据挖掘、人工智能、模式识别等研究领域。随着科学的发展和自动化程度的提高,许多应用领域中都出现规模庞大且种类复杂的信息系统,这些信息系统中包括符号型和数值型等各种类型的数据。经典粗糙集只能处理符号型数据,不能处理其它类型数据。针对这一情况,专家学者将经典粗糙集进行了扩展,其中邻域粗糙集是重要的扩展之一。邻域粗糙集基于邻域关系,通过粒化的方式将类似的对象划为一类,可以有效地处理数值型数据。随着科学技术的不断进步,在数据智能化处理的研究中也出现了许多新问题。在邻域粗糙集的进一步研究与应用过程中也带来了很多新的挑战。例如,如何用邻域粗糙集解决不一致和不完备邻域决策系统中的问题;如何定义一个更适合处理数值型数据的不确定性度量函数;如何设计一个更加高效地属性约简算法等等。针对这些问题,本文以邻域决策系统为研究对象,以邻域粗糙集的模型扩展和以此为基础的属性约简为研究目的。具体研究内容概括如下:(1)本文首先分析了邻域粗糙集处理不一致邻域决策系统的不足之处,为了更好的处理不一致数据,建立了不一致邻域粗糙集模型。接着考虑到经典的不确定性度量方法难以应用到不一致邻域粗糙集模型中,结合模型特点给出了邻域条件熵的启发式函数,并证明其符合不确定性度量的基本条件。同时考虑到条件属性之间的关联程度也会影响约简结果。针对这一情况,本文引入秩相关系数的知识,提出了基于相关系数的属性约简算法。最后通过实验与其它算法进行对比,结果表明了本文所提模型和算法的有效性。(2)不完备的邻域决策系统可能会导致信息出现新的不协调,近些年来,专家学者已经提出了很多方法处理不完备数据,其中,很多研究进行距离度量时没有考虑到已有数据中潜在的信息,具有一定的局限性。针对这一局限,本文分别对数值型和符号型数据构造了新的距离公式,并在这一过程中充分考虑了数据的分布特征对距离的影响,在此基础上建立了不完备邻域粗糙集模型,并进行了实例分析证明所提模型的科学性。接着分析了基于代数和基于信息熵的不确定性度量方法各自的优点和不足之处,结合两者的优点,提出了邻域混合熵的启发式函数用来进行不确定性度量;然后,提出了基于邻域混合熵的属性约简算法。最后通过实验具体说明了该模型在属性约简、分类性能方面的优越性。本文的创新点主要包括以下几点:(1)构造了不一致邻域粗糙集模型可以有效处理不一致数据;在此基础上提出邻域条件熵的度量函数;提出了基于相关系数的属性约简算法,该算法中引入秩相关系数的概念度量属性之间的关联,能够进一步剔除冗余属性。(2)考虑了不完备邻域决策系统中已有数据的分布特征,针对数值型和符号型属性设置不同的距离公式,建立了不完备邻域粗糙集模型;结合了基于代数和基于信息熵的启发式函数各自的优点,建立了一种新的不确定性度量函数:邻域混合熵;提出了基于邻域混合熵的属性约简算法,可以有效地剔除冗余属性并获得较好的分类精度。
其他文献
近年来,职业教育已进入加速发展时期,但随之而来也产生了职业院校重复建设课程、浪费教育资源等问题,不利于人才培养质量的提高,不利于职业教育的发展,不利于社会经济的进步
<正> 一、加强房屋租赁管理的主要做法 (一)建立一个完善的房屋租赁管理机构体系。在深圳市规划国土局下设房屋租赁管理办公室,负责全市房屋租赁的宏观管理工作。按照行政区
常见的植树造林方法主要有播种造林法、根苗造林法、分植造林法。植树造林程序主要分为以下几部分:造林地的清理、整地方式和方法、播种前的种子处理工作、播种方法。植树造
目的:本研究从药物临床试验机构的角度出发,对生物等效性试验实施阶段的质量风险管理进行了研究。方法:通过专家访谈、文献研究、调查问卷等方法以及结合质量风险管理方法中
由中华医学会放射学分会骨关节学组、《中华放射学》杂志主办,《放射学实践》杂志、湖北省放射学会和华中科技大学附属同济医院、协和医院承办的第十二届全国骨关节肌肉系统影
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
加强骨干教师队伍建设,必须理清队伍建设的意义,着力制定骨干教师成长规划并做好专业成长分析,师德建设和专业学习一起抓,两手都要硬。
“喔,法庭开庭就像生产队开会!”村民张某接到法院的传票,要求他参加某天的庭审。参加庭审的前一天晚上,他躺在床上翻来覆去,被不安和紧张缠绕着久久不能入睡。 “Oh, the
期刊
为探索微观形态指标在烟叶品质评价中的应用,采用扫描电镜结合图像分析的方法,研究了不同部位烟叶微观形态的差异及与部分外观、物理指标的关系。结果表明:1烤后烟叶表面细胞