支持向量机及密码子偏性在序列识别中的应用

来源 :东南大学 | 被引量 : 1次 | 上传用户：lostwing56

【摘要】

：

随着人类基因组计划和模式生物基因组计划的完成,公共数据库中生物数据的增长速度越来越快。如何从海量的生物数据中解读、提取和获得有用的生物信息,已成为基因组计划下一步

【作者】

：

周童

【出处】

：

东南大学

【发表日期】

：

2006年01期

【关键词】

：

生物信息学密码子使用偏性支持向量机 G蛋白偶联受体减数分裂重组水平转移基因 RNA干涉

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着人类基因组计划和模式生物基因组计划的完成,公共数据库中生物数据的增长速度越来越快。如何从海量的生物数据中解读、提取和获得有用的生物信息,已成为基因组计划下一步亟待解决的问题。本课题的主旨是尝试利用机器学习的方法并结合某些核酸或者蛋白的序列特征来解决一些生物信息学中的问题。具体研究可以分为二个部分:基因同义密码子使用偏性进行的分析;以密码子使用偏性作为序列特征,利用支持向量机来对生物序列进行的识别。在第一部分中,我们对A型流感病毒、衣原体以及酵母的密码子使用模式进行了分析,并且对导致这些物种采用各自密码子使用模式的内在因素进行了探讨。基因组的碱基组成和基因翻译选择的压力被认为是决定物种基因密码子使用的最主要的两种因素。但是,在我们所分析的生物中,这些内在因素并不尽相同。除了上述的两种主要因素,我们发现DNA复制过程中引起的链间的碱基差异、基因所编码蛋白的亲疏水性、基因的功能类型和基因所处区域的减数分裂重组率等都是能影响基因的同义密码子使用偏性的因素。这些探讨性的研究对于理解物种的进化以及指导基因的体外表达都有着重要作用。我们还发现在基因的不同区段里,其密码子使用偏性也有区别。为此,我们定义了相关的统计量:密码子区段使用偏性。通过对酵母和冠状病毒基因的计算分析,我们发现在mRNA编码起始端附近区域的密码子使用偏性与整条序列的偏性存在着差别:稀有密码子相对于其它区段来说,更倾向于出现在编码区的起始位点附近,这可以用“弱势密码子调节假说”来解释。另外,我们也观察到,在冠状病毒基因编码终止端附近,弱势密码子出现的频率也相对较高,我们推测,这也许与基因的表达调控有关。在论文的第二部分中,我们利用支持向量机,结合基因的同义密码子使用偏性,对生物信息学中的一些热点问题进行了研究:我们首次利用核酸序列的信息对G蛋白偶联受体分子的类型进行识别(前人主要利用的是氨基酸序列信息),并取得了很好的预测效果;我们独创性地对酵母基因组减数分裂重组冷热点区的ORF序列进行了分类,结果表明密码子使用偏性是很好的区分重组冷热点的统计量,我们还发现重组冷热点区ORF所编码的蛋白序列存在氨基酸组成上的差异;我们考察了使用支持向量机与密码子使用偏性对细菌基因组水平转移基因进行识别的能力,我们提出,在对细菌基因组的水平转移基因进行识别时,要将受体基因组前导链和滞后链上的基因区别对待,这样在对水平转移基因的预测时会取得更好的结果。另外,我们利用支持向量机技术,使用双联核苷酸使用频率作为序列特征,对干扰RNA的降解效率进行识别,我们取得的预测效果超过通常基于序列特征的打分算法。

其他文献

铜/钢双金属复合材料的制备及其界面研究

随着科学技术的发展,众多行业对金属材料综合性能的要求越来越高。综合考虑经济和性能两方面的因素,单一材料已达不到实际的使用要求。铜具有优异的延展性、减摩性和导电、导

学位

铜/钢双金属真空扩散焊复合界面扩散机制

可控骨组织工程支架材料的仿生构建

为模拟天然骨组织的结构和成分,本研究以羟基磷灰石(HA)和壳聚糖(CS)为主要材料,利用间接快速原位成型(RP)、冷冻干燥和生物矿化技术制备了一系列具有可控结构、孔隙率和孔径

学位

骨组织工程多孔支架原位快速成型壳聚糖生物矿化

纳米珍珠层人工骨的制备及实验研究

研究背景:珍珠层(nacre or mother of pearl)是软体动物珍珠贝科或蚌科动物的贝壳内层部分,其主要成分为文石型碳酸钙,并含有少量有机质和微量金属元素。1992年法国科学家Lop

学位

纳米珍珠层人工骨制备生物相容性生物降解性

振荡水翼水动力性能数值计算与实验研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

水翼/翼型非定常性能波浪形水翼水动力实验构型优化

中华中医药学会儿科分会第26届学术会议暨王烈教授学术思想研讨会会议纪要

中华中医药学会儿科分会第26届学术年会暨王烈教授学术思想研讨会于2009年9月21-23日在吉林省长眷市举行。本次大会由中华中医药学会儿科分会主办，长春中医药大学附属医院承办

期刊

中华中医药学会学术思想研讨会学术会议儿科王烈大学附属医院第一附属医院中医药大学

新鲜度影响需求和价格的冷链品库存策略研究

学位

冷链品新鲜度保鲜努力价格策略灵敏度分析

反腐题材电视剧的大众传播研究

近年来,随着反腐工作的深入推进,“反腐倡廉”成为热议的话题,与社会语境密切相关的反腐题材电视剧在沉寂了十年之后强势回归。反腐剧是我国大力反腐的艺术表现,是文艺工作者

学位

反腐互联网受众主旋律传播效果

关联理论下微信文章标题的语用分析

微信标题在微信文章中占据着重要地位,精彩的标题是微信文章魅力形成的重要条件。读者阅读标题的过程也可以说是他和作者交流互动的过程。笔者运用语用学关联理论的最佳关联

期刊

关联理论微信标题明示—推理

基于CSCW的文档会议系统实现技术

本文是《基于ＣＳＣＷ的文档会议系统》的续篇，介绍当会议系统协议标准，讨论Ｔｃｌ／ＴＫ软件包及对其功能的扩展，最后对语文档会议系统关键部件的实现进行详细阐述。

期刊

多媒体会议系统文档会议系统CSCWMultimedia conference systemDocument conference systemProto

心率变异性测量标准,生理释义与临床应用(续二)

心率变异性测量标准，生理释义与临床应用（续二）ＭｅａｓｕｒｅｍｅａｎｔＳｔａｎｄａｒｄ，ｐｈｙｓｉｏｌｏｇｉｃａｌＩｎｔｅｒｐｒｅｔａｔｉｏｎａｎｄＣｌｉｎｉｃａｌＡｐｐｌｉｃａｔｉｏｎｏｆＨｅａｒｔＲａｔｅＶａｒｉａｂｉｌｉｔｙ首都医科大学心血管疾...

期刊

心率变异性首都医科大学心血管多变量危险度分层时域法室性心律失常测量标准

支持向量机及密码子偏性在序列识别中的应用

与本文相关的学术论文