面向多标记分类的粗糙特征选择方法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:a7343022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周知,除非结构化、多模态、多关联等特性外,高维、多标记也是数据复杂性的主要表现形式。比如,一张图片可能同时包含“夕阳”、“云彩”、和“树木”等标记。一篇文档可能同时包含“非洲”、“内战”、和“石油”等标记。通常这些多标记数据还是高维的,比如基因的序列,图像的像素点,文本的特征词等。数据的高维性通常会增加数据分析算法的空间和时间复杂度,而数据的多标记性会增加模型的复杂度。发展高维多标记数据的特征选择方法不仅对数据建模、机器学习等领域具有重要理论意义,而且具有重要的潜在应用价值。粗糙集理论是一种处理不确定性信息的有效方法,它无需对数据进行先验假设,利用信息粒构造概念近似算子,并在设计的准则下对数据进行约简,然后建立基于规则或其他形式的分类器,已在许多数据分析与挖掘领域中取得广泛应用。本文面向多标记数据分类问题,发展模糊粗糙集和邻域粗糙集模型,应用于多标记数据的特征选择。论文的主要研究内容和结论如下:(1)基于标记相关性的多标记模糊粗糙特征选择方法多标记数据的标记并非是独立的,而现有的多标记分类的粗糙特征选择方法大多都没有考虑标记间的相关性,这影响了所建模型的性能。为解决这一问题,本文提出了属性-标记矩阵的概念,该矩阵能够很好地刻画标记之间的相关性;然后从标记的角度出发,构造了面向多标记数据的模糊粗糙集模型,并设计了相应的特征选择算法。在公开的多标记数据集上验证了所提方法的有效性。(2)基于双重空间粒化的多标记邻域粗糙特征选择方法与单标记数据相比,多标记数据的标记空间粒结构可为数据分析提供更为丰富的信息,而这些信息并未被已有的研究工作所利用。为此,本文融合特征空间和标记空间两个视角,从更全面的视角考虑多标记数据的特征选择问题,基于邻域粗糙集思想,构造了基于标记空间粒的邻域粗糙集模型,设计了相应的多标记数据分类问题的特征选择算法。在公开的多标记数据集上验证了所提方法的有效性。
其他文献
基于内容的图像检索方法在计算机视觉领域备受研究者的关注。首先提取图像的整体语义特征,然后在数据库中查找与之语义相似的图像。检索任务中最重要的环节是图像的特征提取,
最为常用的GPS定位精度较低,且存在信号盲区,而视觉里程计、同时定位与制图(Simultaneously Localization and Mapping,SLAM)等先进的视觉定位技术存在计算复杂度高、算法稳定性差等问题。与此同时,道路结构、场景的建设越来越规范化,使得路标的视觉特征、几何结构信息更为丰富,为车辆定位提供了必要的参考条件。本文通过构建高精度地图模型与GPS定位、视觉定位相结合的方
装配式钢结构节点是装配式钢结构设计的重要内容。近些年来,基于结构韧性理念,众多学者围绕装配式钢结构节点的震后可修复性进行研究,试图通过不同的连接形式,将节点的损伤控制在便于更换的构件上,从而保护主体结构构件。节点可修复性能的研究对于结构抗震和震后重建具有重要的经济与社会价值。本文在已有研究的基础上提出了一种新型的便于震后修复的装配式钢结构节点连接形式,利用有限元方法对新型节点进行深入分析。分别研究
酱油是我国传统的调味料,具有悠久的历史,随着生产技术的不断改善逐渐发展成为第一大调味品,其不仅能改善食物色泽、香味、鲜味,还含有氨基酸、维生素、微量元素等丰富的营养
协同过滤系统在很大程度上缓解了网络上“信息过载”的问题,然而由于自身开放性的因素,使其在面对攻击时会呈现出脆弱性,严重危害到推荐系统。因此如何高效地检测攻击用户成
港口堆场面积大,夜间照明需要大量的大功率灯具,负责向堆场提供照明的灯杆较多且分布广泛。传统的以人工操作为主的照明灯具控制方式存在操控不便、安全性较差、不利于节能降耗等缺点。本文针对某港口堆场照明控制与节能方面存在的问题,结合某港口堆场照明控制的实际需要,研究并设计开发了基于移动通信网络的远程控制系统。该系统由上位机和远程控制终端两个部分构成,两者之间通过移动通讯网络连接。上位机通过无线收发模块发送
采用传统固相烧结法制备二元系0.94Bi0.5Na0.5Ti O3-0.06BaTiO3(BNBT)无铅压电陶瓷。首先研究烧结温度对BNBT陶瓷结构与性能的影响。XRD分析结果表明,在1160℃-1200℃的烧结温度范围内,BNBT陶瓷具有三方相和四方相共存的单一钙钛矿结构,其中四方相的含量居多。晶粒微观结构分析表明,伴随烧结温度的提高,晶粒大小显著增大,在烧结温度为1200℃时,获得了最大的平均
近年来,随着互联网的快速发展,网络信息不断膨胀,其中包含的各色数据也正以庞大的规模快速增长并逐渐积累。这些资源的增长幅度远远超过了用户数量的增长,因此面对海量的数据
当今世界,经济发展迅速,市场需求多变,为满足瞬息万变的市场需求,企业在兼顾多样化和个性化发展的进程中,无疑承担着更大的机遇与挑战。此外,现今时代是知识经济时代,传统企
在移动互联网时代,随着智能手机的运算性能不断提升,电池续航时间短的问题日渐突显。由于短时间内电池技术无法取得革命性发展,优化应用程序的能耗效率已成为解决移动设备续