基于ISAF的球坐标系下单颗粒三维重构算法研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:wu21211721
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
测定生物大分子空间结构是揭示蛋白质分子功能、阐明其相互作用规律的重要基础。近年来,在更易描述分子形态的球坐标系下,使用抑制噪声功能更强的ISAF基函数进行单颗粒三维重构,与其它三维重构技术相比,能够获得分辨率更高的分子结构。但是,该算法刚刚提出,相关研究很少,在精度、速度上都存在不完善的地方,亟待改进。   本文通过分析ISAF算法的重构过程,发现并解决其精度和速度上存在的问题。精度上的问题主要是:频域采样时采用的双线性插值方法不能表现傅里叶信号强跳变性和不连续性,CTF校正时不恰当的CTF曲线会导致校正结果不稳定,CTF曲线采样时采用的单线性方法不符合CTF曲线的特征要求。速度上的问题主要是:生成ISAF基函数极其耗时,需要映射到三维空间的频谱图采样点数量极其庞大,每个采样点都要执行的60对称操作使“二维—>三维”映射操作计算量增加了60倍,需要计算密度函数值的直角网格点数量极其庞大,计算每点密度函数值都需要二重求和、积分、计算jl(2πRr)和Sl,u(θ,φ)等复杂操作。我们采用合适的方法解决上述两方面存在的问题,在一定程度上提高了ISAF算法的性能;最后,我们将这些改进综合起来,开发了基于ISAF的单颗粒三维重构软件包ICTISAF,并且采用RHDV电镜数据进行重构实验,证明这些改进的效果。本文主要贡献包括:   (1)针对ISAF基函数生成极其耗时的问题,提出ISAF基函数快速生成算法。计算ISAF基函数是ISAF重构算法的基本操作,其速度直接影响ISAF重构算法的性能。ISAF基函数是球谐函数的线性组合,其生成过程包括计算组合系数和球谐函数两部分,按照传统方法直接计算这两部分极其耗时。本文综合自然对数法、二级索引、动态规划等方法,提出了ISAF基函数快速生成算法,可以满足大多数问题的实时性需要。   (2)针对频域信号采样精度低及CTF校正效果不佳的问题,设计高保真频域信号抽取及CTF校正方法。在ISAF算法执行过程中,需要对原始电镜图像的傅里叶信号进行抽取、CTF校正等措施,从而得到满足要求的高精度傅里叶信号。抽取频域信号时采用的双线性插值方法不能表现傅里叶信号特征,降低了其抽取精度;传统CTF校正方法精度不高、稳定性差。本文采用符合傅里叶信号特性的滑动窗口全局插值法抽取傅里叶信号,精度高、灵活性强;此外,又提出了基于正弦高斯调制和样条插值的CTF校正方法,既改善了CTF曲线的形态,又提高了CTF值的获取精度,在一定程度上提高了CTF校正效果。   (3)针对需要执行“二维→三维”映射操作采样点数量极其庞大的问题,提出基于过采样和径向采样点旋转角度不变性的快速采样策略。ISAF重构算法需要将频谱图上的采样点映射到三维空间,构建拟合系数方程组。但是,需要执行映射操作的采样点数量极其庞大,严重影响重构速度。本文借助过采样原理和径向采样点旋转角度不变性,提出新的等角度采样策略,这种策略只需将一个同心圆上的采样点映射到三维空间,其它同心圆上采样点在三维空间的映射位置可以直接推导出来。在映射阶段,这种策略带来的理论加速比为(Rm+1)/2,其中Rm为最大傅里叶半径。   (4)针对每个采样点都要执行的60对称操作的问题,提出基于20面体60对称特性的三维空间快速映射策略。在映射过程中,为了获得更多的图像信息以提高信噪比,需要将每幅电镜图像翻转60次,然后映射到非对称单元。相对柱坐标系下的重构算法而言,球坐标系下的映射操作极其耗时。经过分析发现,由于球坐标系下非对称单元的特殊性,该操作是可以省略的冗余操作。删除该操作后,理论上可以提高60倍的映射速度。   (5)针对密度函数计算极其耗时的问题,设计密度函数快速计算方法。密度函数计算可以直接生成分子密度图,是.ISAF重构算法的重要操作。但是,该阶段的计算复杂度是O[(LM)8],严重影响整体性能。本文设计一种密度函数快速计算方法,将密度函数计算过程划分为三个阶段,以球坐标系为中间桥梁,将其时间复杂度降低为O[(LM)7]。   (6)针对基于ISAF重构算法软件包极其匮乏的问题,开发基于ISAF的单颗粒三维重构软件包ICTLSAF。将上述改进综合起来,采用可视化编程技术,开发了软件包ICTISAF,可以实现单颗粒三维重构的全部功能。和传统软件相比,该软件除了性能卓越之外,还具有初始模板自动化智能选择策略,根据特异性自动选择初始模板,为用户节省了大量时间。为了验证ICTISAF的性能,采用RHDV电镜数据进行重构实验,结果表明,该软件在性能上优于常用软件IMIRS、recISAF和EMAN。
其他文献
作为新型、可靠、实用的柔性交流输电系统FACTS(Flexible AC TransmisonSystem)装置,磁阀式可控电抗器(MCR:Magnetic Valve Controllable Reactor)的出现为高压、中高压、超高
Web服务协商是自动协商领域的一个重要研究方向,而云制造服务平台作为一个将制造资源和制造能力虚拟封装成服务进行分享的分布式云平台,其服务交易过程需要构建合理的服务协商
人机交互是人与机器之间进行沟通的桥梁,在普适计算领域占据着非常重要的位置。手势是人们日常生活中比较直接的交流方式之一,实现利用手势与计算机进行交互,可以使人机交互
随着科学研究的不断发展,科学计算越来越依赖于大规模的计算机系统。随着计算机系统规模的不断增大,整个系统的可靠性也随之下降。深入研究高性能计算机系统的容错技术,提高
随着信息技术的快速发展,文本流数据广泛出现在各类应用中,例如电信网络中的短信数据、社交网络中的舆情数据。这类数据的主要特点是源源不断、产生速度快、时变性强。在很多
语义资源是自然语言处理领域众多应用的基础。采用人工方式构建知识库需要耗费大量时间,并且由于覆盖率低而无法满足实际应用的需求。近年来基于用户生成内容的知识获取成为信
学位
医学图像作为重要的可视化手段,在临床诊断和治疗、医学教育和培训以及医学研究和交流上都有不可替代的作用。随着计算机软硬件技术的发展,医学图像中的目标识别、分类、分割和
由于混沌系统具有对初始条件和系统参数的极端敏感性、连续宽带谱、遍历性、有界性、内在随机性、分维性、普适性和统计特征等,使得混沌系统的研究得到了飞速的发展,特别是其
随着物联网的迅猛发展,射频识别技术(Radio Frequency Identification,简称RFID)作为物联网发展的排头兵,已经成了市场最关注的技术。简单的RFID系统,加上中间件、网络技术、