基于迁移学习的功能性小外显子的预测

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:A55190684
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
选择性剪接为蛋白质组和转录组赋予了更高的复杂性,使得长度有限的编码蛋白质序列能够在既有长度的基础上,产生各种各样的不同结构和功能的蛋白质,为物种的多样性做出来巨大的贡献。众多的研究表明选择性剪接和疾病有着千丝万缕的联系,透彻了解外显子选择性剪接的调控机制被看作是攻克很多疾病的关键。然而由于包括测序技术和序列分析软件在内的限制,使得绝大部分研究人员将研究的重心放在了长度较长的外显子上,长度较短的外显子(本文称小外显子)一直未受到相应的重视,直到近年两篇《Cell》和《Genome Research》上的重量级文章的发表,使得研究人员意识到现在小外显子的数量已经很多。《Cell》文章指出相对于长度较长的外显子,小外显子表现出更高的序列保守性和更强的调控能力,能通过调节蛋白的互作用结构域来影响神经系统的形成。然而目前功能性小外显子的数据库并没有建立,虽然拥有数量众多的小外显子,其具体功能性与否并不能有效判断。针对小外显子的现状,本文以功能性小外显子的预测为研究对象展开分析。首先,对小外显子的特征进行选取和分析,特征分为基因层面和蛋白层面的特征,之后利用聚类算法选出分类效果较好的特征,其次,根据micro-indel数据标签可靠而小外显子致病性标签不易获取的特点,对micro-indel数据进行特征提取,最后通过迁移学习,将micro-indel数据和小外显子的数据映射到低纬度的共同空间上,在这个空间上,两者的分布相同,之后通过机器学习的方法,在这个新的维度上对小外显子和micro-indel的数据进行训练和预测,最后获得一个分类效果良好的预测功能性小外显子的模型。通过对上述方法识别后的功能性和中性小外显子数据进行特征分析,得知用迁移学习后得到的结果中,预测为有功能的小外显子更倾向于有二级结构,并且更倾向于出现蛋白结构域中,保守性打分也更高。这与之前的研究成果是一致的。这证明了本研究的方法是有效的。同时本文也在众多文献中查证了一些致病小外显子实例,并对它们进行了预测,得到的预测结果同实际结果相同,实例方面也证明了本研究方法的有效性。
其他文献
本论文以十四胺为核的1.0G超支化聚酰胺-胺大分子为原料,与吡啶-2-甲醛进行席夫碱反应得到超支化吡啶亚胺配体,然后将得到的超支化吡啶亚胺配体与六水氯化镍进行络合反应,合
近年来,全球环境恶化问题加剧迫使人们加快对新能源的研究。在诸多种类的新能源中太阳能以环保、高效并且可大面积应用的优点赢得了科学家们的青睐。多年以来科学家一直在寻
本论文首先介绍了一些相关的研究背景,在高斯白噪声驱动下,考虑自催化机制的种群模型,随后在非线性动力学中,阐述一些与本论文相关的随机延迟理论,包括非高斯噪声和时间延迟
有限能量Airy光束具有无衍射、横向自由加速和自愈特性,在光学实际应用方面具有很大的潜在价值,例如光学微粒操控、光子弹、高强度等离子体通道产生和电子加速等领域。但是这
时滞微分方程是具有时间滞后的微分方程,它用于描述既依赖于当前状态也依赖于过去状态的发展系统.由于充分考虑了历史对当前状态的影响,它在力学、生物学、神经网络、保密通
本学位论文研究了二维水槽内不可压缩流体的数值模拟方法.建立了基于不可压缩势流方程和不可压缩粘性带耗散Navier-Stokes方程数学模型,研究了二维水槽内势流方程和带耗散Nav
微分几何是一门历史悠久的学科,近年来它对其它自然学科的影响也是更加深刻和广泛。曲面论和曲线论是微分几何中两大主要内容,其中平移曲面是三维欧氏空间与三维Minkowski空
股权结构对公司效率的影响一直是公司财务理论关注的基本问题。传统的委托代理理论关注在相对分散的股权结构下由于所有权与经营权分离所导致的股东与经理人之间的冲突。适度
钙离子信号系统在调控真菌的各种生理过程方面具有关键作用,曲霉属也不例外。在构巢曲霉Ca2+/CaM/Calcineurin/CrzA钙离子信号通路中,Calcineurin发挥着中心调节者的作用,因
于2012年10月至2013年9月,对苏州工业园区湖泊水体和河流水体的浮游动物组成及群落结构进行了研究,分析了浮游动物密度和生物量的年度变化,探讨其分布与水体理化因子间的关系