局部加权学习的研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:pickbaobei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文是基于机器学习中的局部加权学习(Locally Weighted Learning,简称LWL)进行了深入的研究,这种学习方法既可用于回归问题(局部加权线性回归),又可用于分类问题(局部加权朴素贝叶斯)。局部加权回归问题已经广泛的运用于机器人控制和数学统计问题中,并取得了良好的效果。局部加权分类问题还是比较新的方法,在分类算法中与其他分类方法比较,取得了较好的实验结果,提高了分类的精度。而它们都需要对训练实例根据它们离测试实例的距离进行加权。传统的局部加权学习算法中实例间距离度量方法采用的是欧几里德距离公式计算,这种距离通常涉及所有的特征。本文就针对这一问题进行了深入的研究,提出了改进的方法。 本文首先介绍了局部加权学习在国内外研究的现状、目的及意义,并阐述了论文的研究思路和步骤。然后,在分析局部加权学习算法的基础上,详细论述了局部加权回归学习模型的框架和核心算法:数据相似性、局部加权矩阵、数据加权函数、模型平滑参数和计算查询点局部方差与预测置信区间的方法;局部加权分类模型的思想:将局部加权方法有效的结合朴素贝叶斯算法,减少了属性间的依赖性,有效提高分类精度;同时也阐述了局部加权算法中存在的一些问题,其中针对具有不同属性类型的样本实例,修改其距离函数,使名词性和数值性属性数据得到更精确的分类。常用的距离函数能够很好地处理连续属性值,但是处理名词性属性值的效果却不好,而值差分方法(Value Difference Metric,简称VDM)能够合理地计算出名词性属性值之间的距离,但它在连续属性值上效果较差。所以采用了插入值差分方法(Interpolation Value Difference Metric,简称IVDM)不但能够很好的处理好名词性属性值之间的距离,而且在处理混合型属性和数值型属性之间的距离,也能取得较好的效果。 本文深入介绍了三种相似性距离度量方法,并将这三种方法替换局部加权学习算法的距离函数,以局部加权朴树贝叶斯方法为例,针对这种方法分类效果做实验。通过在WEKA中将上述三种距离函数与局部加权朴素贝叶斯结合后分类的结果进行了详细的分析与比较。实验表明,改进了局部加权学习的距离函数有效的提高了局部加权算法的效率和可靠性。最后,总结本研究的成果与不足,并提出今后模型改进的方向,有利于解决数据挖掘中的实际应用问题。
其他文献
机器人是一项包含多项技术领域的综合性研究项目,自主移动机器人是机器人学科中技术含量比较高的一个分支,具有广泛的应用前景。本文在阅读大量文献的基础上,以华南理工大学
随着互联网的飞速发展、网络平台的多元化,以及数码电子设备越来越普及,数字图像的存储量正呈爆炸性地增长,如何快速地查询、高效地组织这些图像成为一个亟待解决的问题。显
随着计算机和互联网技术的迅速发展和逐渐普及,数字图书馆作为一种重要的知识共享平台受到了越来越多的关注,不仅在商业领域受到了产业界的重视,而且在学术领域同样具有研究价值
本文主要研究基于点特征的图像匹配算法。点特征是图像上具有明显特性并能够把目标标识出来的点,它可以较好的描述目标的特征。点特征检测和图像匹配技术在计算机视觉和图像理
片上多处理器(CMP)是当前主流的微处理器体系结构,它利用现有的海量晶体管资源在单个芯片上集成多个处理器核,通过多核并行执行的方式开发指令级和线程级等各个层面的并行度来
当计算机网络应用的日益普及,伴随而来的是一系列的网络安全问题,入侵检测技术作为一种主动的信息安全保障措施,备受关注。 本文首先以网络安全为基础,介绍了入侵检测的概念、
Petri网提供了一种以图形和数学为基础的形式化建模方法。现在它已经成为建模和分析工业系统的成熟工具,其应用领域也越来越广泛,涉及到工作流管理,软件工程,并发程序设计,异步电
P2P是由若干互相对等的网络结点组成的一种网络结构,其中每个网络节点称为对等点,对等点消除了服务器和客户端间的角色差别,通过它们之间的信息直接交换完成计算和信息的共享.JX
压缩感知理论是近几年兴起来的一门新的信号采样理论,它打破了传统信号采样理论在采样频率方面的限制,引起了学术界的巨大轰动。传统信号采样理论包含了四个方面的内容:采样、
随着国际化交流日益频繁,多语人才的需求越来越迫切,口语测试的普及率、公平性受到广泛关注。面对传统的口语测试所带来的时空受限、组织成本高、评估主观性强、反馈信息单一等