符号属性数据的半监督聚类与属性选择

被引量 : 0次 | 上传用户:xuanka11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习领域中,聚类和属性选择问题已经成为分析数据的有效手段。聚类是无监督学习的基本技术,其目的是在没有数据先验信息下分析数据的结构。一般而言,一个好的聚类算法要遵循类内(Intra-class)对象相似度最大而类间(Inter-class)对象相似度最小的原则。属性选择是在属性全集中选择重要的属性去掉冗余的属性,在提高学习效率和预测精度,降低算法复杂度都有明显的效果。近年来,半监督学习成为一个研究热点,而其中的半监督聚类与半监督属性选择是重要研究内容。然而,绝大多数现有半监督聚类与半监督属性选择方法关注的是连续性属性数据,对符号属性数据相关研究还比较少。在现实应用中符号数据大量存在,因此符号属性数据的半监督聚类和属性选择是也是亟待研究的内容。本文对符号属性数据的半监督聚类与属性选择进行了研究,分别提出两种半监督聚类方法和半监督属性选择方法。基于聚类集成思想,提出了一种符号属性数据半监督聚类的集成策略。为了有效进行集成,构造了四种基于权重的投票策略去获得最终的聚类结果。此外,提出了一种分裂再组合的聚类方法,利用无监督和有监督信息的形成等价关系,将样本划分成一个个小的簇,然后再将这些小簇通过基于不同集簇间距离度量策略的层次聚类方法进行组合得到最终的聚类结果。受到监督学习中属性选择算法mRMR的启发,本文重新定义了半监督环境下的属性相关性和冗余性,构造一种最小冗余最大相关的符号数据半监督属性选择算法。此外,将粗糙集理论中传统的依赖度拓展到了半监督领域,提出了耦合依赖度的概念,它不仅可以度量条件属性对决策属性的依赖程度,还能度量条件属性间的冗余程度。基于耦合依赖度,构造了一种符号数据半监督属性选择算法。实验结果表明,所提出的半监督聚类和属性选择方法能有效实现符号属性数据半监督聚类和特征选择。
其他文献
报道近期诊治狼疮性脂膜炎1例。左侧面部肿胀性暗红斑块2年。查体:左侧下眼睑、面颊部可见弥漫分布浸润、肿胀性暗红斑块,表面光滑无鳞屑,触之质硬、结节感,无触痛,皮温偏高
以大众POLO原型车为基础,对其动力系统关键总成进行了重新设计,确定了其参数并与之与匹配,在MATLAB/Simulink环境下完成了混合动力电动汽车整车建模,并通过在CYC_UDDS和CYC_E
<正>推进军队保卫工作军民融合深度发展是贯彻"四个全面"战略布局和国家总体安全观的具体举措,可有效解决当前军队保卫工作的突出问题和难点瓶颈。有利于军队改革和全面建设
针对坝体结构优化分析中存在的数值模型建立困难、繁琐等问题,采用BIM模型与通用有限元分析方法耦合应用方式,建立快速有限元分析的一般流程,并将其在某坝体结构优化分析中进
随着超声成像技术的日趋成熟,各种基于超声成像的应用也越来越多。由于医学超声成像设备具有实时、无损、廉价、高灵敏度等优点,在医学界中临床医师们普遍采用医学超声图像作
锅炉作为重要的动力设备,使用越来越多。通过对国内外锅炉控制现状的研究,我国锅炉的自动化控制也只是实现简单的操作和保护,并没有对机组起到灵活控制,并且响应速度慢,所以对锅炉
目的通过骨不连动物模型的实验研究及初步临床应用,探讨恒古骨伤愈合剂结合经皮注射自体骨泥治疗骨不连的疗效。方法(1)动物实验研究:预制75只新西兰大白兔右侧桡骨“截骨”骨
宫颈癌多是经过不同程度的原位癌而逐渐转化为浸润癌的。近年来愈来愈多的著者承认了在原位癌与浸润癌之间尚存在着一个微小浸润型(Microinvasive carcinoma of the cer-vix
经济的发展使人们在各个领域之间联系日益密切,对应用文写作水平要求越来越高,应用文写作已经成为高校大学生必备的基本技能。但目前高校应用文写作的教学情况并不乐观,主要
我国的建设类企业在2000年到2011年这段时间,拥有良好的经济发展环境和政策支持。许多建筑类企业不再简单从事工程的建设、架构,而是积极的向建筑工程规划、投标以及建设过程中