高维仿生信息几何学研究及其在模式识别中的应用

被引量 : 10次 | 上传用户:andychinajj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式识别成为国内外人工智能研究的热点问题之一。由于样本的高维数据集呈现低维几何流形分布的特性,使得传统模式识别方法在很多问题上遇到了瓶颈。如何认识和利用高维数据的内部几何分布特性,探索人类对事物认识的方式是解决模式识别问题的新方向。高维仿生信息几何学正是从几何学的角度来认识和分析数据分布,试图通过模拟人类形象思维来解决模式识别中的实际问题。我们从高维仿生信息几何学在模式识别的应用中发现以下问题:首先,如何对高维数据集进行合理的覆盖,也就是怎样提取高维数据集的“核”来构造覆盖区域;其次,在样本数量比较大的情况下,怎样提高识别效率?怎样构造半监督分类器?等等。针对以上一些问题,本文试图将高维仿生信息学理论和流形学习、机器学习等方法结合起来找到答案,本文研究工作主要包括以下几方面:研究了传统仿生模式识别的超香肠神经元模型和网络学习算法,针对其不足提出了多自由度神经元模型和网络学习算法,通过人脸识别实验比较了两种神经元模型的优劣,与SVM算法的比较证明了仿生模式识别的覆盖型神经元识别算法在“小样本”数据库的识别问题上更具优势。针对邻近样本点误识问题,提出了核邻近点Fisher判别分析,这一算法的目的在于使最近的异类数据点和最远的同类样本点在投影子空间的距离尽量扩大,从而减少误识率,并通过人脸识别实验验证了算法的有效性。针对传统的仿生模式识别算法的不足之处,结合流形学习的理论提出了基于流形距离的仿生识别算法(主要包括基于局部PCA主流形的求取和切距离的求取两部分),并通过实验证明了基于流形距离的仿生识别算法比传统仿生模式识别算法更适合“大样本”数据库的识别问题。传统仿生模式识别方法是通过单纯形神经元覆盖来逼近样本的分布流形,而基于流形距离的仿生识别算法是通过将数据集投影“主流形”上来寻找样本的分布流形,是解决同一个问题的两种方法。因为都需要预知样本的类别,它们都属于有监督的模式识别方法。另外我们还研究一种无监督的聚类算法。基于高维仿生信息几何学的“同源连续性原理”改进了谱聚类算法中的相似性量度,提出了基于路径相对相似度的谱聚类算法,改善了谱聚类算法对高斯函数中尺度参数的敏感性。最后,是对高维仿生信息学方法的应用研究。基于高维仿生信息学形象思维方法提出了适用于图像检索和图像配准的特征提取方法,给出了图像检索和图像配准的原型系统,实验证明了提取特征的有效性。
其他文献
交联聚乙烯(XLPE)电力电缆在高压电网中的应用越来越广泛,电网的安全运行与电缆的绝缘状况紧密相联,局部放电是造成电力电缆绝缘失效的主要原因之一,也是反映电缆绝缘状况的重要指
阐述了遥感技术今后应用发展的趋势及遥感地物定量化的意义和内涵,介绍了实现遥感地物定量化分析的高级工具ENVI,分析了利用遥感影像处理软件ENVI的高光谱分析工具进行地物识
微风振动是输电线路风致振动最为常见的一种形式,会导致线路的疲劳破坏。微风振动的频率一般约为3~150Hz,振动单振幅一般不大于导线的直径。本文旨在对单档距单根导线防振锤系
近年来越来越多的研究发现多不饱和脂肪酸具有抗肿瘤活性,但是其抗肿瘤的机理尚不清楚。本文既评估了多不饱和脂肪酸对正常胃细胞和胃癌细胞的脂质过氧化物积累量、抗氧化酶
<正>随着电子商务市场迅速升温,物流的重要性不断提升。战略合作伙伴将会在配送中发挥关键作用短短五年时间内,中国电子商务市场(占中国B2C市场总量的90%左右)势头如日中天。
在全球经济一体化不断加深的今天,对外贸易对经济增长至关重要。由于众多学者将研究重点放在出口对经济增长促进作用上,忽视了进口对经济增长的影响。但事实上,随着进口贸易
太阳能是资源最丰富的可再生能源,具有独特的优势和巨大的开发利用潜力。太阳能应用前景固然光明,但是目前种种技术阻碍了光伏发电系统的进一步普及和发展,储能技术便是其中重要
目的:解决肿瘤患者便秘问题,使治疗方案顺利完成。方法:对40例肿瘤便秘患者,运用中医理论对其进行正确辨证施护,并与40例常规护理进行对照。结果:辨证施护组与常规护理组差异
输电线路是电力系统的重要组成部分。目前在电网停电事故中,大部分是由于各种输电线路发生故障引起。高压输电线路一旦发生故障,将引发大规模输电环节中断,保障高压输电线路