论文部分内容阅读
随着新技术的不断出现,目标识别从以往针对单源的研究向多源发展。不同类别的数据源从多个角度对目标进行描述,带来了数据量的激增,在拓展识别分类特征内涵的同时,也带来大量信息冗余和数据相关,导致“维数灾难”的问题,严重影响机器学习的效率与分类算法的性能。如何有效筛选并利用各类传感器提供的信息具有重要的研究价值及现实意义。特征选择算法,是海量数据高价值信息筛选的典型途径之一,作为一种有效的降维方法广泛应用于模式分类和目标识别等多重领域。因此,本文立足于信息论的基础理论,以信息熵作为基本度量策略,开展服务于目标识别应用的多特征选择方法研究。首先,针对传统基于互信息的特征选择算法中评价准则函数度量量级不均衡的问题,提出了一种结合排序的rMIFS(ranking MIFS)算法。算法采用先将相关度具体数值进行由小到大排序,而后再使用排序的序号来替代其具体数值的方法,改善了评价准则函数在特征选择后期具有倾向性的缺陷。在公开数据集上验证所提方法的有效性,结果表明所提rMIFS算法提高了特征选择全过程中评价准则函数的公正性,从而提高了所选最优子集的分类能力。然后,针对Shannon互信息在计算上严重依赖概率密度函数估计的精确性,引入一种新型度量方式——生存Cauchy-Schwartz互信息,提出了一种SCS-rMIFS(Survival Cauchy-Schwartz ranking MIFS)算法。生存Cauchy-Schwartz互信息使用生存函数替代概率密度函数,用这种互信息进行计算时可以有效避免因样本量大小、人工参数设置等问题对度量数据集相关性与冗余性的影响。在公开数据集上验证所提方法的有效性,结果表明所提SCS-rMIFS算法提高了对特征度量的准确性,在每次选择中能选出对分类最有利的特征,从而提高了所选最优子集的分类能力。最后,基于以上研究,针对多源图像目标识别任务中的感兴趣目标检测问题,论文提出了一种图像多特征选择与超像素分割算法(SLIC)相结合的分割策略,通过增加SLIC算法中距离向量的维数,并赋予分割标记语义约束,以可见光和红外图像融合进行行人检测为应用示范,实现了对感兴趣目标的快速检测提取。在真实数据集上验证所提方法的有效性,结果表明算法在克服目标分割不完整及碎片化方面,分割效果有改善。