基于统计学习理论的分类方法研究

被引量 : 0次 | 上传用户:liuning2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量数据分类一直是数据挖掘、机器学习和人工智能的研究热点,海量数据分类是应用训练集构造一个分类器,应用这个分类器能够完成后续分类工作。本文深入研究了两种基于统计学习理论的数据分类算法,即朴素贝叶斯分类以及粗糙集分类的工作原理,并针对朴素贝叶斯分类算法的增量分类算法、基于粗糙集的属性约简算法等存在的一系列问题,提出了相应的解决方法。针对朴素贝叶斯算法不具有增量分类能力及海量数据增量分类算法时间复杂度较大等缺点,提出一种基于空间特征向量的增量贝叶斯算法,给出了将向量空间原理及空间欧氏距离结合获取样本特征向量的方法及增量分类过程。仿真实验结果表明,本文提出的算法在大量样本参与分类的时候,能够相对快速并且准确的完成分类任务,能够给出一个相对准确的样本分布情况。针对基于Skowron差别矩阵的属性约简算法存在的应用范围受限、时间及存储空间浪费和效率瓶颈等问题,通过提出一种浓缩布尔矩阵的概念,提出了一种基于浓缩布尔矩阵的属性约简算法:以布尔代数的形式来解决现有差别矩阵存储空间大、生成效率低等缺点;给出一种新的用于直接生成分辨函数最小析取范式的算法,有效改善了算法的时间和空间复杂度,从而提高了属性约简算法的效率;另外在约简率上本文所提算法也有明显的优势。针对上述所提出的属性约简算法不适应动态变化的对象集、不支持增量式约简算法等问题,在深入分析新增对象与原决策表对象间的关系的基础上,提出了一种适用于决策表的增量式属性约简算法,实现了对属性约简结果的动态更新、维护和管理,提高了属性约简的效率,理论分析和实例验证表明算法是有效可行的。
其他文献
合作学习是当今新课改形势提出的一项重点学习任务,人是社会群体中的一员,无论做什么事都离不开与他人的协作,在学习过程中亦是如此。有效的合作学习,能够使学生们解决疑难的
国有商业银行的稳健经营对国家经济的正常发展有着极为重要的影响。当前,国有商业银行面临着信用风险、操作风险、市场风险、道德风险等多种风险因素,而信用风险是我国金融风
采用预乳化种子聚合工艺,在多元丙烯酸酯中添加自交联功能单体N-羟甲基丙烯酰胺和反应型乳化剂2-丙烯酰胺基-2-甲基-丙基磺酸铵盐,研制出性能优异的耐热耐水型乳液压敏胶。同
艺术教育包含很多的内容,舞蹈教学是其中一个重要组成部分,正因为它所具有的多样性和丰富性,使得大众对舞蹈的热爱越来越浓.本文就舞蹈教学中动作的讲解与示范作为基点,进行
党员干部作为社会主义建设的核心力量,必须坚定共产党员理想信念。本研究针对转型期党员干部理想信念问题,对全国十六省市的2113名党员干部进行了问卷调查,收回有效问卷1590
当代中国共产党的党员干部是否具有坚定的共产主义理想和中国特色社会主义信念,不仅直接关系到党的执政能力、关系到经济社会的科学发展和和谐社会建设、关系到党员干部队伍
异香兰素,化学名3-羟基-4-甲氧基苯甲醛,是一种非常重要的香料和食品药品领域应用广泛的医药中间体。近年来市场对异香兰素需求量不断增大,使得异香兰素的合成与应用研究也成
随着电影创作的深化,许多香港和台湾的电影人选择北上拍合拍片,这就出现了台湾和香港的电影人想要保持本土的文化,又要获得内地观众认同的现状。本文分析了香港电影人在合拍
2002年7月1日,随着《国际刑事法院罗马规约》的生效,国际刑事法院正式成立。作为世界上第一个常设性国际刑事法院,它的成立标志着国际刑法领域的重大发展,对国际社会产生了重
教育是中华民族伟大复兴的基础工程,小学阶段教育又是基础的基础。随着我国经济的不断发展,人们的经济水平提高了,对教育越来越重视,家长及学生对课外辅导的需求也越来越旺。