生物信息平台构建及序列比对算法研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:xixiaoqiqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是当今最重要、最前沿的科学发展领域之一,已被广泛用于基因序列数据的获取、处理、分析和管理等许多方面,对于分子生物学和生物医学研究的深入发展发挥了巨大作用。序列比对是生物信息学中一种基本的信息处理方法,对于发现核酸和蛋白质序列上的功能结构和进化的信息具有非常重要的意义。本文的工作是在本人所从事开发的柑橘生物信息平台的基础上进行的。针对生物信息平台开发过程中遇到的问题——海量的基因数据库序列比对,我们在平台中采用了快速、高效的序列比对算法。本文的主要工作包括基因序列比对算法研究和生物信息平台的构建。本文首先采用了一种基于.NET和SQL Server相关技术构建生物信息平台的方案。在此基础上选择INSDSqe XML作为中间数据格式,以XML为数据存储语言,使用大型关系数据库SQL Server构建二级生物信息数据库。其次,对BLAST算法进行了改进,提出了基于十六进制编码序列通过循环位移寻找最优比对序列的思想,本算法通过将二进制表示的DNA序列转换为十六进制,并根据序列片断相似度得到最佳搜索窗口值,从而提高搜索速度和准确度。本文在搭建好的生物信息平台基础上,以柑橘基因数据为例建立出实验环境并实现了相应算法。最后是生物信息平台的构建,本文所建立的生物信息平台是以生物信息学为基础,通过编程而实现的生物信息处理系统,包括生物信息二级数据库和生物信息处理模块,其作用是通过序列检索、序列比对、相似性搜索、同源性搜索等操作从大量的序列信息中获取基因结构、功能和进化等知识,以便理解数据中蕴含的生物学意义,决定研究方向和策略。实验表明,本文所构建的生物信息平台整合多个一级数据库数据及服务资源,并且开发和整合了大量的生物信息工具,为用户提供统一的查询平台;数据格式、查询方式与公开数据库兼容性好,查询灵活、功能强:运用XML存储数据使得数据库内容更新更加方便;改进算法的应用则使系统对用户操作的响应时间更短,查询的准确率更高;自己独立开发,维护与开发方便、成本低。
其他文献
期刊
内高压成形技术作为一种制造空心轻体构件的先进制造技术,用其制造的零件具有重量轻,刚度好,零件数量少,可减少后续机械加工和组装焊接量等优点,已经广泛地应用于汽车、航天
<正>中国是一个有数千年治水历史和面临当代多重水危机的发展中大国,实施流域综合管理是解决水问题、维护河流健康、实现可持续发展的战略选择。
为保证宿迁地区管道输水灌溉工程技术的合理推广应用,针对宿迁地区特点,构建以工程条件、应用环境、投入能力和效益水平为准则的适宜性评价指标体系。采用层次分析法与模糊综
3DNow!:(3Dnowaiting)AMD公司开发的SIMD指令集,可以增强浮点和多媒体运算的速度,它的指令数为21条。
为了进一步加快苹果电脑公司在中国这个重要市场的发展步伐,苹果电脑公司现对中国区进行人事调整。即日起,苹果亚太区将直接向全球副总裁John Brandon先生汇报,同时康志勇先生将
<正>1.1洞庭湖的形成1.1.1洞庭湖是断陷构造沉降盆地中的汇水洼地我们生活的这个地球已经存在46亿年了,46亿年时间是由地质学对地球上最古老岩石的判测得出的。20世纪认为湖
会议
尘肺是中国目前发病人数最多的职业病,肺结核是尘肺的主要并发症;本文回顾分析2007年4月~2010年4月本院17例矽肺合并肺结核患者误诊为其他疾病的临床资料,总结误诊的原因,为以
目的:评价尤瑞克林治疗急性脑梗死(acute ischemic stroke,AIS)的疗效及安全性。方法:将100例AIS患者分成观察组和对照组各50例。对照组常规治疗,观察组在常规治疗的基础上加用尤