论文部分内容阅读
冷冻电镜(cryo-electron microscopy,cryo-EM)三维重构技术是确定生物大分子结构与功能的主流方法之一,图像处理技术已经成为冷冻电镜三维精细结构精析的重要手段。然而,针对信噪比低、非定形、不对称和不具全同性的大分子样本的cryo-EM图像,如何设计出合理的cryo-EM单颗粒图像分类网络,提高cryo-EM单颗粒图像分类准确率、大分子颗粒识别精度等依然是极具挑战性的问题。因此,本文提出融合基于傅立叶变换的平移和旋转不变特征量(Fourier transform based translation and rotation invariants,FTTR-invariant)的CNN-ELM分类网络模型的方法来解决以上问题。文中主要研究对cryo-EM单颗粒图像分类识别关键技术的方法,包括获取cryo-EM图像FTTR-invariant和基于CNN-ELM分类网络模型的cryo-EM单颗粒图像分类。具体研究内容如下:(1)针对cryo-EM图像信噪比低、非定形等特征,导致cryo-EM图像识别过程中精度低等问题,本文提出通过计算cryo-EM图像FTTR-invariant的方法来进行cryo-EM单颗粒图像特征提取。该方法首先计算给定cryo-EM单颗粒图像的傅立叶光谱图像,通过笛卡尔坐标系到极坐标下的变换和加权计算出cryo-EM单颗粒图像的FTTR-invariant;其次,使用t-分布式随机近邻嵌入的方法(t-Distributed Stochastic Neighborhood Embedding,t-SNE)对FTTR-invariant降维;之后,将欧式距离转换为条件概率来表示点之间的相似度;最后,使用梯度下降算法来度量cryo-EM图像之间旋转不变特征相似性,并求出对应长度的低维特征向量之间的归一化互相关向量。实验结果表明,本文的方法较其他三种经典的特征提取方法效果最佳,对不同形状、取向角度的二维cryo-EM单颗粒图像特征向量的提取,降维及可视化效果上均有所提高。(2)针对cryo-EM单颗粒图像分类准确率低和生物大分子三维重构周期长的问题,本文设计了属于不同cryo-EM单颗粒图像数据集的CNN-ELM分类网络模型。将CNN-ELM分类网络模型提取的cryo-EM单颗粒图像的特征向量与FTTR-invariant融合,并对属于不同取向角的cryo-EM单颗粒图像进行快速分类。针对不同取向角度的cryo-EM单颗粒图像数据集,使用卷积神经网络(Convolutional Neural Networks,CNN)、极限学习机(Extreme learning machine,ELM)和本文设计的CNN-ELM分类网络模型的方法进行了分类实验。实验结果显示,精度方面:本文设计的CNN-ELM分类网络模型方法包含了CNN和ELM的优点,分类精度高、速度快。性能方面:与主流的二维(two dimensional,2D)分类软件RELION和EMAN2相比,模型的分类精度和效率均有所提高,对cryo-EM单颗粒图像测试数据集分类精度最高达到了85%。本文设计的CNN-ELM分类网络模型实现了在不同取向角度的cryo-EM单颗粒图像数据集上进行2D分类,取得良好的分类效果,解决了cryo-EM单颗粒图像分类精度低和效率低的问题,增强了CNN-ELM分类网络模型的性能,缩短训练时间和三维重构的周期。