机器学习中若干特征选择算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:Fijy520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在分析特征选择相关性质的基础上,研究并设计了多种环境下特定的特征选择算法,而这些也是目前特征选择的研究热点。 主要结论: 1.利用指数熵作为特征排序准则,并结合改进的模糊特征评价指标,设计了一种新的非监督特征选择方法,效果很好。 2.将维数约简中两种典型方法(特征抽取与特征选择)相结合,利用K近邻聚类,设计一类基于主成分分析的特征选择方法,将没有实际意义的主成分投影到原始特征空间,选择关键的原始特征。 3.在深刻分析K近邻分类器的损失函数基础上,提出新的基于K近邻分类损失一间隔的特征选择评价准则和算法,并利用能量模型进行理论分析。实验结果表明该算法能获得比其它进行K近邻规则的特征选择算法(如Simba、Mitra和Reljef)更好的性能。
其他文献
本课题的任务是为安全微处理器LX-1164设计片内的存储控制单元与高速缓冲存储器控制器。设计实现了一个片上内存管理单元与Cache控制器的设计,提出了一种64位超标量微处理器
软件测试是保证软件产品可靠性和正确性的有效方法,其中设计和生成有效的测试用例是决定测试质量的重要因素之一,而测试用例自动生成可以节省测试时间,降低开发成本。模型检验是
本文依据软件工程开发软件的严格要求,着重阐述了药品信息管理数据库系统设计,介绍了药品信息管理系统的详细设计和开发过程。 鉴于医药管理信息化已经成为医药行业发展的大
网页链接的抽取是指将网页源代码中的<a>标签的href属性的取值按照用户的需求提取出来。目前网页链接的抽取主要是将网页中全部链接抽取出来,并没有对链接进行分类,抽取的结
虚拟现实系统能够逼真地模拟真实场景,与其他信息载体相比具有直观、具体、生动、信息量大、具有实时性和交互性等许多显著优点,它能提供给参与者真实的体验和逼真的感受,这些优
无线体域网是近年来新兴的具有广阔发展前景的技术,其将会对我们未来生活的各个方面产生巨大的影响。比如基于无线体域网的健康监控系统,它不仅能够让长期住院的病人离院治疗
在信息资源爆炸性增长的环境下,信息抽取成为一种从海量资源中获取有价值信息的重要手段。事件时序关系识别是事件信息抽取的后续任务,对问答系统、信息抽取和文本自动摘要等
视觉是人类获取信息的重要手段,并随着计算机技术的不断发展,一门新的综合性学科应运而生—计算机视觉。双目立体视觉作为计算机视觉的一个重要的组成部分,近年来已成为人们
决策支持系统是一门新兴的管理信息技术,能为决策者提供各种决策支持信息,可提高决策的质量和效率。数据仓库和数据挖掘是数据库研究、开发和应用的最活跃的分支之一,也是新
软件开发是一项复杂的工作,需要好的人员、好的技术以及好的过程才能得到满意的产品。统一软件过程RUP是一种用例驱动的,以架构为中心的,采用迭代增量方式开发的软件工程过程