论文部分内容阅读
仿生模式识别是一种不同于传统模式识别的理论方法,其理论基点是特征空间中同源样本的连续性原理,并通过对同类样本在高维空间中的最佳覆盖来达到认识和区分样本的目的。本文对仿生模式识别算法进行了深入的研究与学习,将仿生模式识别的思想应用在文本分类当中,并在此基础上提出了基于文本相似度的神经元生成算法。该算法的基本思想是从训练集当中选择最相似的样本,使用这样的样本来生成多权值神经元,进而构成多权值神经元网络。本文在基于仿生模式识别的文本分类系统中,实现了基于文本相似度的神经元生成算法。实验表明,基于文本相似度的神经元生成算法在文本分类当中取得了较好的性能,而且要优于传统的中心法、近邻法、Winnow法以及贝叶斯等文本分类算法。