【摘 要】
:
在众多数据挖掘技术中,多分类器融合技术是近几年来的研究热点,它利用多个分类器来解决问题,可以显著提高系统的泛化能力,达到比个体分类器更好的分类精度和鲁棒性,受到许多
论文部分内容阅读
在众多数据挖掘技术中,多分类器融合技术是近几年来的研究热点,它利用多个分类器来解决问题,可以显著提高系统的泛化能力,达到比个体分类器更好的分类精度和鲁棒性,受到许多学者的关注。而使用此技术解决多类分类问题更是一个急需解决的问题。纠错输出编码算法是多分类器融合技术中一个用于解决多类分类问题的典型算法,它将一个多类分类问题分解为若干个二类分类问题,利用多个单分类器的融合模型来处理多类问题,并在许多领域得到应有。
本文探讨了传统纠错输出编码算法的特点与存在问题,对其进行改进与扩充,从编码过程、融合策略、半监督学习、动态数据环境等方面拓展其应用领域,设计并实现相应的改进算法。主要工作包括:
(1)半监督层次纠错输出编码算法(Semi-HECOC),使用层次编码和半监督学习技术,提高数据的适应性。
(2)基于KNN模型的层次纠错输出编码算法(KNNM-HECOC),改进融合方式,提高分类器的性能。
(3)一种解决概念漂移问题的方法(IKnnM-DHecoc),快速适应动态数据环境并有效检测概念漂移问题。
(4)基于特征的概念漂移检测方法(FSDA),扩展概念漂移的检测途径。
不同的公共数据集和现实应用数据对这些算法的测试表明本文在对纠错输出编码算法研究的有效性,推广和扩充了纠错输出编码算法的研究工作,具有一定的应用价值。
其他文献
G蛋白偶联受体(GPCR)是一种重要的信号分子受体,在生命活动中起着重要作用,是大约50%所有现代药物的作用目标。随着计算机计算能力的大大增强及人们对生理活性分子与生物分子相
对于大多数的物体,我们都可以通过纹理来描述其表面错综复杂的细节。纹理合成技术从开始发展到现在一直受到众多研究学者的关注,在许多领域都发挥着巨大的作用,是当前图像处
随着图形学以及三维计算机虚拟图像技术的迅速发展,纹理合成技术已成为当今计算机图形学领域的热点之一,并在现实化虚拟仿真、机器视觉处理等领域得到应用。纹理能够展示出细
随着信息技术尤其是网络技术的发展,越来越多的应用领域,如网络监控、垃圾邮件分类、传感器网络等,需要对其以每天数以百万Gbit增长的流数据进行实时处理。由于流数据经常呈现高
超立方体以其正则性、对称性、强层次结构和高容错性等优越性质成为最具吸引力的互连网络之一,但它并不是各方面性质都最好的互连网络。迄今为止,文献中提出了超立方体的多种变
由于加工一个MEMS器件的周期较长,经费较高,因此,在设计之初都要进行仿真来验证所设计的结构是否符合实际需求。为此,本组在之前开发了虚拟工艺软件,旨在通过仿真得到器件的三维结
P2P技术是目前计算机网络领域的一个研究热点,它的发展将影响人们获取信息的方式和整个计算机网络的概念。P2P充分利用网络节点的自身资源,实现整个网络资源的高效共享。副本
基于摘要的垃圾邮件识别方法是众多垃圾邮件识别方法中十分重要的一种。这类技术通过对比邮件摘要相似性来判定垃圾邮件。然而,现有的识别技术大都采用集中式的摘要管理模式,该
随着通信技术日新月异的发展,相关的科研理论不断与时俱进,三维模型由于自身巨大的优势而逐渐成为主流,并广泛应用于虚拟现实、机械制造等行业领域,尤其在三维模型语义标注与