支持向量机及密码子偏性在序列识别中的应用

来源 :东南大学 | 被引量 : 1次 | 上传用户:lostwing56
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划和模式生物基因组计划的完成,公共数据库中生物数据的增长速度越来越快。如何从海量的生物数据中解读、提取和获得有用的生物信息,已成为基因组计划下一步亟待解决的问题。本课题的主旨是尝试利用机器学习的方法并结合某些核酸或者蛋白的序列特征来解决一些生物信息学中的问题。具体研究可以分为二个部分:基因同义密码子使用偏性进行的分析;以密码子使用偏性作为序列特征,利用支持向量机来对生物序列进行的识别。在第一部分中,我们对A型流感病毒、衣原体以及酵母的密码子使用模式进行了分析,并且对导致这些物种采用各自密码子使用模式的内在因素进行了探讨。基因组的碱基组成和基因翻译选择的压力被认为是决定物种基因密码子使用的最主要的两种因素。但是,在我们所分析的生物中,这些内在因素并不尽相同。除了上述的两种主要因素,我们发现DNA复制过程中引起的链间的碱基差异、基因所编码蛋白的亲疏水性、基因的功能类型和基因所处区域的减数分裂重组率等都是能影响基因的同义密码子使用偏性的因素。这些探讨性的研究对于理解物种的进化以及指导基因的体外表达都有着重要作用。我们还发现在基因的不同区段里,其密码子使用偏性也有区别。为此,我们定义了相关的统计量:密码子区段使用偏性。通过对酵母和冠状病毒基因的计算分析,我们发现在mRNA编码起始端附近区域的密码子使用偏性与整条序列的偏性存在着差别:稀有密码子相对于其它区段来说,更倾向于出现在编码区的起始位点附近,这可以用“弱势密码子调节假说”来解释。另外,我们也观察到,在冠状病毒基因编码终止端附近,弱势密码子出现的频率也相对较高,我们推测,这也许与基因的表达调控有关。在论文的第二部分中,我们利用支持向量机,结合基因的同义密码子使用偏性,对生物信息学中的一些热点问题进行了研究:我们首次利用核酸序列的信息对G蛋白偶联受体分子的类型进行识别(前人主要利用的是氨基酸序列信息),并取得了很好的预测效果;我们独创性地对酵母基因组减数分裂重组冷热点区的ORF序列进行了分类,结果表明密码子使用偏性是很好的区分重组冷热点的统计量,我们还发现重组冷热点区ORF所编码的蛋白序列存在氨基酸组成上的差异;我们考察了使用支持向量机与密码子使用偏性对细菌基因组水平转移基因进行识别的能力,我们提出,在对细菌基因组的水平转移基因进行识别时,要将受体基因组前导链和滞后链上的基因区别对待,这样在对水平转移基因的预测时会取得更好的结果。另外,我们利用支持向量机技术,使用双联核苷酸使用频率作为序列特征,对干扰RNA的降解效率进行识别,我们取得的预测效果超过通常基于序列特征的打分算法。
其他文献
随着科学技术的发展,众多行业对金属材料综合性能的要求越来越高。综合考虑经济和性能两方面的因素,单一材料已达不到实际的使用要求。铜具有优异的延展性、减摩性和导电、导
为模拟天然骨组织的结构和成分,本研究以羟基磷灰石(HA)和壳聚糖(CS)为主要材料,利用间接快速原位成型(RP)、冷冻干燥和生物矿化技术制备了一系列具有可控结构、孔隙率和孔径
研究背景:珍珠层(nacre or mother of pearl)是软体动物珍珠贝科或蚌科动物的贝壳内层部分,其主要成分为文石型碳酸钙,并含有少量有机质和微量金属元素。1992年法国科学家Lop
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
中华中医药学会儿科分会第26届学术年会暨王烈教授学术思想研讨会于2009年9月21-23日在吉林省长眷市举行。本次大会由中华中医药学会儿科分会主办,长春中医药大学附属医院承办
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
近年来,随着反腐工作的深入推进,“反腐倡廉”成为热议的话题,与社会语境密切相关的反腐题材电视剧在沉寂了十年之后强势回归。反腐剧是我国大力反腐的艺术表现,是文艺工作者
微信标题在微信文章中占据着重要地位,精彩的标题是微信文章魅力形成的重要条件。读者阅读标题的过程也可以说是他和作者交流互动的过程。笔者运用语用学关联理论的最佳关联
本文是《基于CSCW的文档会议系统》的续篇,介绍当会议系统协议标准,讨论Tcl/TK软件包及对其功能的扩展,最后对语文档会议系统关键部件的实现进行详细阐述。
心率变异性测量标准,生理释义与临床应用(续二)MeasuremeantStandard,physiologicalInterpretationandClinicalApplicationofHeartRateVariability首都医科大学心血管疾...