【摘 要】
:
生物信息学的主要任务是利用信息处理方法揭示海量生物学数据中蕴涵的生物学意义、探索生命活动的奥秘。生物基因组中存在大量的非编码区序列,这些序列中包含许多未知的生物功
论文部分内容阅读
生物信息学的主要任务是利用信息处理方法揭示海量生物学数据中蕴涵的生物学意义、探索生命活动的奥秘。生物基因组中存在大量的非编码区序列,这些序列中包含许多未知的生物功能或信息,对它的结构进行分析已成为生物信息学研究最重要的课题之一。
论文通过对Y染色体NC-DNA结构比较分析的研究,寻找非编码区中具有“锤头结构序列+串联重复序列”的模式结构,探索其中可能具有的生物意义。主要研究的内容和取得的成果如下:
(1)通过对生物信息数据库结构的分析,根据ncbi上获取非编码区序列的方法,使用VC++网络编程技术,设计并实现非编码区序列智能下载工具,方便快捷地在Oracle中建立Y染色体NC-DNA本地二级数据库。
(2)对串联重复序列识别算法进行研究,结合非编码区的特点,使用DC3算法构建后缀数组,结合最长公共前缀识别精确的串联重复,并使用回绕动态规划对其进行扩展,实现模糊串联重复识别。使用“变异度”来衡量模糊串联重复序列的有效性。该算法能够快速有效地识别出基因中满足给定条件的串联重复序列。通过实验数据说明算法的效率和作用。
(3)研究锤头型核酶结构特点,自行设计算法实现了“疑似锤头结构”序列搜索。使用该算法能够找到具有一定锤头数目的疑似目标序列。
(4)设计并实现了对人类、小鼠和黑猩猩Y染色体NC-DNA序列进行分析的原型系统,并对结果进行了可视化,测试结果表明,论文所采用的研究方法可行,达到了预期目的。
其他文献
计算机网络的复杂性与日俱增,为实现网络安全智能化管理必须对网络进行有效的监测。本文通过利用现有的网络监测技术基于智能Agent中社会性的定义建立了一个可面向社会Agent设
随着新世纪的到来,高新技术发展和全球经济化的加速,我国的产业结构和就业结构正在发生重大变化,对人才的需求更加多样化,对人才培养的质量要求更高。高等职业教育作为高等教
随着多媒体技术和网络通信技术的飞速发展,视频已经广泛地用于政治、军事、商业、医疗和教育等行业。除了政治和军事这两个需要高保密性的领域外,其它领域对视频加密的需求也
由于无限传感器网络(WSNs)具有链路开放,节点生存周期有限,网络拓扑结构动态变化等特性,其安全性受到极大挑战。传统的防火墙机制在探测攻击行为方面具有很大的滞后性,而入侵
21世纪步入了信息时代,越来越多的科技产品引入了人脸识别技术。人脸识别可以帮助人们快速、精确的进行身份的识别,具有十分重要的研究价值和意义。本文对人脸识别的关键技术
随着信息技术的迅猛发展,社会对Web应用系统的需求日益增长。如何快速开发高质量的Web应用系统,以满足社会的需求,已成为当今软件开发领域中的热点问题。在现代Web应用系统开
越来越多的研究表明,长非编码RNA(long non-coding RNA,lncRNA)在许多生物过程中具有重要的功能。而这些长非编码RNA的变异或功能失调会导致一些复杂疾病的发生。目前关于长
随着数字信息技术的飞速发展,海量的多媒体数据已越来越多地融入了人们的日常生活之中,然而如何能够快速有效地从中查找到所需要的信息却是一个严峻的挑战。同时,在多媒体信
随着变电站自动化系统采用以太网进行通信,网络信息安全问题也越来越受到重视。本文依据IEC 61850(变电站通信网络与系统)和IEC 62351(电力系统数据与通信安全)等国际标准确定的变电站自动化发展方向及通信安全需求,分析了目前变电站通信网络所面临的安全威胁及实时性要求,为客户机/服务器通信模型和对等通信模型分别提出了安全认证方案。针对客户机/服务器模型,采用了强口令认证算法SPAS,并结合双
随着计算机技术的飞速发展,数据压缩技术成为解决海量信息存储、传输的关键技术。这种技术可以提高磁盘的有效容量和IO的有效宽带,进而加速程序的执行。数据压缩主要分为有损