无指导学习环境下属性选择问题应用研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:leegimars
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
属性选择的核心思想是要在原属性全集的基础上,通过一定的算法和模型去除那些缺乏识别能力和预测能力的冗余属性,得到的新属性子集在数据挖掘的建模性能上优于使用整个属性集所达到的效果。属性选择作为数据挖掘过程中的一个重要步骤可以有效地降低特征维度,去除不相关属性,提高模型准确率以及增加模型的可解释程度。属性选择问题可以分为有指导学习环境下的选择和无指导学习环境下的选择。“有指导”和“无指导”的一个显著差别就在于数据样本的类别问题。如果用来建立模型的训练集合中的每个样本已经有了明确的类别属性,那么在这样的数据集上建立模型的过程就是有指导学习。如果数据集中的样本没有明确的类别属性,纯粹利用数据集内在特征和结构来建立模型的过程就是无指导学习。众所周知,在有指导学习环境下,出现了很多性能优越、实用性强和操作方便的属性选择方法。其中的典型代表有Relief-F、信息增益和卡方检验等。过去传统意义上的属性选择通常是指在有指导学习环境下的属性选择。但是近年来,随着数据挖掘技术渗透到更多行业领域,无指导学习环境下的属性选择问题也正在日渐为人所关注。由于无指导学习没有关于样本类别的重要信息,在面对大量属性的数据集所进行属性选择的效果不如有指导学习环境下的结果。本文的重点就是对无指导学习下的属性选择进行深入研究,以此为无指导学习环境下的提高数据挖掘的效率提供一些实践经验。本文首先是全面地综述属性选择的意义、方法等,尤其是在无指导学习环境下属性选择的发展现状,这些都为本文的进一步研究提供了理论基石。在已经深入了解和体会现有发展的基础上,提出一种新型的属性选择模型——无指导学习环境下基于属性相关性分析和聚类算法的属性选择方法ULAC(Feature Selection for Unsupervised Learning Based on Attribute-Correlation Analysis and Clustering Algorithm)。然后通过实验方式来验证ULAC模型的有效性、显著性和适用性。有效性的分析,是验证ULAC本身是一个无指导学习环境下的属性选择方法。显著性的分析,是将该模型与其他当前比较流行的无指导学习环境下的属性选择方法进行比较,从而验证其效果的显著性和优越性。适用性的分析,则是研究ULAC在什么情况下的模型组合性能最优和ULAC对不同数据集合特征的适应程度。最
其他文献
人工智能的大背景下,要想切实改善大学生的综合素质,就要从创新能力入手,充分总结以往的教学经验.本文就计算机及信息类对于大学生的创新提出了相对完整的参考建议,从分析培
本文吸收国内外微课资源应用的最佳经验和做法,从教学模式、教学方式和教学策略三个方面对技工院校微课资源的应用进行了深入的研究和探索.
现代社会下,高科技技术与产品不断普及,计算机在各个领域都获得了人们的高度重视,并使人们的日常工作更加便利、快捷.怎样才能有效加强我国教育水平的发展,使其紧紧跟随时代
商业网点是城乡商品市场体系的物质实体,是商品流通的基础条件,也是繁荣城市、发展农村市场的基本要素。中小城市商业网点的发展与大城市有较大的差别,如何科学控制总量及合理布
产品差异化竞争是企业竞争的一个重要策略。在短期内,企业通常进行价格竞争。但是在比较长的时期内,企业的成本结构和产品特性是可以一起或分别变换的,因此不同企业生产的产品几
随着社会经济快速的发展,企业对员工的要求越来越高,不仅是自身综合素质的体现,更要有精湛的专业知识以及市场生存的把控能力,因此《市场营销》则是一门抢手课程,这主要体现
随着科学技术的飞速发展,多媒体作为一种极富时代性与先进性特征的教辅工具,被广泛应用于高职计算机教学中来,有效地提高了专业教学的收益.基于此,本文就多媒体技术在高职计
随着经济的腾飞,科学技术的快速发展,我们进入了信息化网络时代,人们的生活和互联网息息相关,不可分割.在“互联网+”的背景下,新媒体的兴起给社会环境带来了巨大的变化.大数
众所周知,计算机的出现加快了现代人们生活的节奏和步伐,当然包括各行业的运用与发展,尤其在教育中出现的微课运用更是如虎添翼,使教育更上一层楼,其中在中职计算机专业微课
学习力,是实现学生内在潜力的重要表现形式.基于此,本文主要从自主学习能力提升、学习规律研究等方面,阐述信息化条件下中职生学习力培养方式,以达到明晰教育实践要点,促进国