基于组合分类器的数值型不确定性数据分类方法研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:xiaoF123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的分类算法主要是针对处理确定性数据分类的情况,确定性数据是指训练数据集和测试数据集中的每一个数据样本的每一属性值都是唯一确定的。处理确定数据分类问题的方法很多,如C4.5决策树、SVM支持向量机和贝叶斯分类等。但现实情况中所采集到的数据往往是不确定的,不确定性数据具体表现为数据样本每一维度的值都是在一定范围内服从某种分布的数据的集合。传统的分类算法在处理这一类的不确定数据的分类问题时会由于自身固有的局限性,直接导致分类精度的下降。   因为不确定数据每一属性值都不是一个唯一确定的值,而是一个以[A,B]的形式表示符合一定分布的取值区间,因此每一个不确定性数据样本,在高维空间不再是单个确定的点,而是高维空间上的一团点。针对处理这样的不确定性数据分类问题,本文提出了四种算法:分别是基于期望值的AVG算法、基于采样的USM算法、基于采样的组合分类器EUS算法和基于权重采样的EWS算法。AVG算法和USM算法分别通过期望点和采样点把原不确定性数据分类转化为传统确定数据分类问题;EUS算法是通过采样的方法,引入组合分类器的思想,对不确定数据对象按其密度分布函数进行采样,通过采集不同的训练集来构造不同的子分类器,从而组成组合分类器来解决不确定数据的分类问题。EWS算法是在基于采样的组合分类器EUS算法基础上的改进,引入Adaboost思想和置信度概念,减少对置信度高的样本采样,增加对置信度低的样本采样,更加关注那些容易被错分的不确定数据对象,构造组合分类器来解决不确定数据的分类问题。最后,本文通过对UCI14个数据集进行实验验证了EUS算法及EWS算法的良好性能。
其他文献
虚拟群体运动仿真一直是各大虚拟现实课题组的重要研究方向。仿真技术的成果在群体管理(检阅系统、暴乱处理)、公共空间设计(建筑、城市设施规划)、灾害防演等方面发挥举足轻
本文针对现实网络中传统SSLVPN记录层的安全缺陷、传统公钥体制数字签名规模小、数字签名验证现场性不强、记录层的实时性较差等方面的问题,结合对SSLVPN基本原理的论述,特别
软件规模估算在软件生命周期特别是早期开发阶段有着重要作用,是作为项目计划以及资源分配的重要依据。虽然占据重要地位,但是软件估算在软件工程中一直是比较薄弱的一环。软件
随着时态信息处理技术和互联网应用的广泛深入,为了更方便地反映现实世界的时态数据,实现不同网络环境之间的信息共享和数据交换,时态XML的研究已成为当今的一个研究热点。目前
如今,数字水印技术成为网络中有效的实施版权保护和保障信息安全的重要手段。现有的数字水印算法对图像压缩,滤波等信号处理攻击有很好的抵御效果,但不能抵抗旋转、缩放、平
人脸表情识别是指利用计算机分析特定人的脸部表情及变化,进而确定其内心情绪或思想活动,实现人机之间更自然更智能化的交互。其研究对于增强计算机的智能化和人性化,开发新
学位
人群仿真是基于计算机图形学、力学、心理学、社会学等多种学科的一种仿真建模技术,已经被广泛地应用于许多领域。现实社会中的公共安全及建筑设计领域,要求精度和效率更高的仿
近年来数据挖掘技术在各个领域取得巨大进步,但如何处理带误差的不确定性数据仍然是数据挖掘算法的一个挑战。传统的数据挖掘算法通常都假设收集到的数据是精确的,没有丝毫误差
人脸识别技术作为一项生物特征识别技术具有十分重要的意义。人脸识别技术涉及到了计算机技术,图像处理,模式识别和机器视觉等多个领域。一个完整的人脸识别系统,应该具有两