论文部分内容阅读
大脑作为人体最为复杂的器官,不仅是因为它有着极其复杂的结构,而且它有着众多的高级功能,能够进行记忆、思维,产生意识和情感等。现在技术上已经能够对小鼠的脑神经元结构实现矢量化,这有利于下一步“人脑研究”的进行。本文研究大脑神经元胞体的几何分类问题。首先将神经元胞体的极坐标数据转换成三维向量数据,绘制胞体的三维网线图,并结合生物学神经元胞体的结构特点。根据形状对胞体做预分类。其次,抽取胞体的重要几何特征,绘制样本各特征的直方图及密度曲线,刻画其分布。再次,对胞体特征做降维处理,提取主要特征,消除冗余特征,以降低算法的复杂度,提高聚类的准确性:采用主成分分析和谱分解两种方法进行降维,测试发现,谱分解降维后的k-means、fcm、基于密度的聚类和层次聚类结果准确率均高于主成分20%以上。故后面的聚类算法中,选谱分解降维提取特征。接下来进行聚类方法的研究。单个聚类算法各有优劣,本文采用了一种可以综合众多聚类算法优点的集成学习算法,提高了聚类的可靠性。集成算法中,本文采用赋有权重的投票方法作为共识函数:先从胞体特征数据样本中随机抽取1/3数据,进行4种聚类方法实验,再依据这1/3胞体的分类准确率的高低确定投票权重。最后,将原始特征数据做谱分解降维,再利用提取到的新特征先做单一方法的聚类,再将以上四种聚类方法集成一种新的方法,然后将他们进行对比,得到了优于所有单一方法的较为理想的分类结果。实验结果表明,该方法用于胞体分类时,识别相似胞体能力强,可用于脑区分类,或寻找异常胞体,进行相关医学研究。本文提出的基于谱聚类的集成学习方法,是一种既能很好地提取特征、又能有效地降维,还能准确地分类的模式识别方法,可节省存储空间和时间成本,降低算法复杂度,实现大数据处理功能。