基于k近邻分类准则的特征变换算法研究

被引量 : 0次 | 上传用户:lookluo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征变换和测度学习在模式识别中具有十分重要意义。通过特征变换,可以得到样本新的表示以及样本间更合适的距离测度,从而更有利于后续处理,如聚类和分类等。不降低维数的测度学习算法通常是将样本从输入空间映射到一个维数相同的新空间,而具备降维能力的测度学习算法则是将样本从输入空间映射到一个较低维的新空间。本文首先对标准正交变换、白化变换、主元分析和线性判别分析等特征变换进行了比较深入的分析,试图探讨这些特征变换方法的本质以及相互之间的联系。接着,对局部线性嵌入LLE和Laplacian特征映射等流形学习算法进行了介绍。然后,提出了一种新的基于k近邻分类准则的特征变换算法—判别近邻嵌入算法DNE(Discriminant Neighborhood Embedding)。DNE算法构造一个判别邻接矩阵来描述多类样本数据集的局部几何结构,利用该判别邻接矩阵定义了一个代价函数,以求得一个最优的变换矩阵,将样本映射到新的空间。在新的空间中,样本之间的距离测度发生了变化,同类近邻样本点会尽可能地靠近,异类近邻样本点尽可能地远离。通过谱分析,DNE算法能够估计出新空间的最佳维数,这是和其他很多相关算法的区别所在。DNE算法能有效解决高维模式分类中经常存在的“维数灾难”问题,且通过将样本映射到一个低维空间,降低了k近邻分类器的计算代价。该算法是非参数的,不必假定样本符合Gaussian分布,对不同分布的数据更具有适应性;该算法是非迭代的,训练过程更有效率;且不存在高维小样本情形下矩阵奇异的问题。利用神经网络模型和核方法,我们将DNE算法进行了非线性扩展。在非线性情况下,先将样本点映射到一个高维Hilbert空间,然后在高维空间内找到适合k近邻分类的子空间,此新空间的最佳维数可能低于样本的原始维数,也可能等于或大于样本的原始维数。实验表明非线性DNE算法特别适合维数较低但样本数较多的数据集。
其他文献
城市的历史街区沉积着一个城市的历史文化和传统风貌,是城市宝贵的遗产和资源,是中华民族几千年城市文明的生动见证。然而,近二十年来受我国城市开发建设大潮的冲击,众多历史文化
目前,转型升级后的传统国有施工企业面临新问题、新形式、新挑战,企业宣传工作也竞争激烈。施工单位中的国有企业如何运用新媒体与传统媒体两种形式,以适应热点时事的宣传、社会
农村发展问题是一个综合、复杂的问题,它包含着政治、经济、社会等多方面的含义,而今农村发展正处在一个重要的“转型期”,要求从粗放型的发展模式向集约化、可持续的发展模
<正> 朱丹溪学医于罗太无,太无为刘河间再传弟子,河间主泻火,丹溪宗之。朱氏初从许谦学理学,后复致力于医方,穷研《内经》、《神农本草经》等古典医著,并能折衷刘(河间)、李(
<正>市场消息称,2015年美国PVC市场情况在很大程度上将取决于能源与上游乙烯的走势。2015年年初,美国PVC出口价下降30美元/t,上周三FAS休斯顿报价为720美元/t。市场人士称购
介绍了使用斜板沉淀槽和气动连续式砂滤器高效稳定的去除和回收离心母液水中PVC颗粒的新工艺,解决了离心母液水进生化处理装置前悬浮物含量过高的问题。
大肠埃希菌ATCC25922、临床分离头孢噻肟(CTX)敏感大肠埃希菌7771、7880、CTX耐药大肠埃希菌7992与浓度范围为(0.015~128)μl/ml的CTX于35℃孵育2?h后,用碘化丙啶(PI)标记上流
高校统战工作是全党统战系统的重要组成部分,直接面对高校的师生和各民主党派,历来是统战工作的重要前沿。网络信息时代的到来和网络在高校广泛的普及开来,为高校统战工作带
流动商贩是城市商业的重要组成部分,其空间分布格局与正规商业不相同。本文以正规商业和流动商贩的引力可达性指数,比较两者在同一区位的可达性差异,依此将两者的空间分布关
警察与秩序紧密地联系在一起,是秩序的产物。对警察而言,秩序是核心价值,自由是次要价值。有自由、有秩序是人类的理想模式,自由是秩序的自由,秩序是自由的秩序。历史证实,只