基于全相位数字信号处理的基因识别算法研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:kwzheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA序列是遗传物质的载体,它由四种碱基按照一定顺序组合而成。在一整段DNA序列中,只有其中一部分能够被编码成蛋白质,称为基因的外显子。而不能被编码成蛋白质的序列称为内含子。基因识别算法的目的是从未知的DNA序列中检测出有效的外显子片段。本文通过信号处理的方法检测未知基因中的编码区的位置。对基因信号做数字信号处理的第一个步骤是对DNA序列做数值映射,通过数值映射将符号序列转化为相应的数值序列,然后通过信号处理方法分析其频域特性。由于基因编码区的频谱具有三周期性,这种性质通常是由编码区密码子的偏性造成的。故可以由此特征来识别基因的外显子与内含子。针对DNA序列的数值映射问题,本文分析并研究了DNA序列的几种常用的数值映射。在三种最常用的且物理意义较明确的数值映射下,推导了DNA序列功率谱与信噪比的快速算法。讨论了三者之间的相互关系,并给出了矩阵形式的闭式表达式。针对基因识别问题,传统的谱分析方法对数据进行截断时会造成频谱泄露,影响基因识别的准确度。为了减少频谱泄露,抑制背景噪声,本文将全相位数字信号处理技术应用到基因识别算法中。此项技术通过对原始数据进行全相位数据预处理,保持数据截断后首尾波形的连续,因而极大程度上减少了截断效应。本文针对基因识别算法设计相应的全相位FFT谱分析结构,以此来提取出基因内部的三周期信号,达到对基因外显子准确预测的目的。同时将多采样率信号处理模型与谱分析结构相结合,在减少计算量的同时可实现流水线操作。为了进一步提取DNA序列中的三周期信号,提高基因识别的准确率。本文将全相位FIR模型与基因识别算法相结合,设计了适合于基因预测的全相位窄带滤波器。由于全相位FIR滤波器具有严格的线性相位,并且具有相位不变性,则又将相位旋转算法与全相位FIR滤波相结合,可以得到更为准确的预测结果。最后一节中引入定量的评价指标来对各种不同基因识别算法的效果做出评价,实验结果证明了该算法在核苷酸水平上有较高的预测准确性。
其他文献
随着时代的发展与社会的进步,人们对计划生育工作的质量与水平的要求越来越高,人们更加注重人口的质量,而不再是人口的数量。为了适应新时期的要求,提高计划生育宣传教育水平,需要
期刊
糖尿病是一种常见的内分泌代谢疾病。久病可引起系统损害,导致眼、肾、神经、心脏、血管等组织的慢性进行性病变,引起功能缺陷和衰竭。糖尿病治疗主要包括饮食及运动、口服降糖
雷达中频数字接收机采用数字信号处理算法,使用易于实现算法的CPLD、DSP 芯片或高性能的单片机微控制器,体积小,重量轻,造价低,结构简单,易模块化,系统配置更新快,维护升级方
门诊导诊处是一所医院对外服务的第一窗口和前沿阵地。导诊服务作为医院医疗服务的重要组成部分,其服务质量的高低对医院的社会影响至关重要,做好导诊护士综合素质的培养工作已
随着课程教学改革的不断深入,教学模式也发生了改变,综合性教学与传统的教学不同,它的教学理念是以学生为中心,培养学生的发现问题、解决问题的能力,提升学生的创新意识,使学生的综
目的:分析神经内科护理教学中临床病例的应用效果。方法:随机选取2014年1月至2015年12月我院神经内科实习的护士200名,根据不同带教模式把200名实习护士分为两组,一组选取100名实
近几年来,随着人们对信息传输数据越来越高的要求,需要更快、更可靠和更灵活的通信系统,正交频分复用(OFDM)这种多载波调制移动通信系统受到广泛关注。OFDM在频率选择性衰落信道
目的:;探讨分析五官科学案例教学的有效性与可行性。方法;将我校09级临床医学专业的学员分成2组,观察组给予案例教学法,对照组给予传统教学法,通过问卷调查和考试成绩比较两种教学
论文主要对网络流量及性能特征的有效测量方面进行了深入研究,并以研究测量技术与提出算法为目的,在高速网络测量及基础架构、网络流量特征抽样测量、网络性能特征抽样测量和网