基于深度学习的RNA打分函数的研究

来源 :苏州大学 | 被引量 : 3次 | 上传用户:zhanghtlx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RNA对生命体的遗传具有重要作用,RNA二级结构是理解RNA功能的初级钥匙。由于缺乏对RNA相对完整的了解,对RNA二级结构打分是生物信息学中的一个挑战。对RNA二级结构打分函数的研究,难点在于对长范围RNA序列的打分函数精确度提高。本文针对短中范围的RNA二级结构应用双向LSTM(Long Short-term Memory)作为打分函数建模基础,并且针对长范围的RNA序列设计了一个重组层将联结特征与RNA子结构特征进行融合,将深度模型提取的特征进行拟合。本文的训练算法不但使用遗传算法调整了正负目标变量比例,而且利用k-folder算法对模型进行交叉验证。递归神经网络由于包含比较多的参数,训练模型消耗的时间比较长。基于此,本文应用Hyperopt超参数优化框架对深度序列模型的训练进行改进,通过快速的并行搜索,我们取得了与人工选择超参数不相上下的模型精度。皮尔森相关系数相较于改进后的双向递归神经网络提高了3%左右,违反率降低了0.2%左右,打分精度又有了一定性的提高。本文结果不但对RNA二级结构打分提供了一个可靠选择,也为深度模型的训练提供了一个有效的实践。
其他文献
针对数字图像的版权保护问题,研究人员已经做了大量的研究。其中,基于内容的图像拷贝检测技术研究已经取得了较大的进展。现有的图像拷贝检测算法,主要是依靠Bag-of-Words (B
随着互联网时代的到来,网络上各种文本的数据量呈爆发式的增长。其中,短文本形式的文本也逐渐成为主流的文本形式。面对大量的短文本,如何高效的获取其中有效的信息,是如今数
乳蛋白合成的机理作为泌乳生物学领域的基础科学问题之一受到广泛的关注,目前在转录和翻译水平上调控乳蛋白合成的信号通路已经被众所周知,但是还有一些细致的生化调控机制还
本文在约化模型的框架下,研究信用联结票据(CLN)的复制,定价和交易对手风险对冲问题。首先从最简单CLN开始,在假设没有对手风险的情况,本文得到CLN的动态价格过程,然后使用银
黔北地区位于中上扬子板块的东南缘,研究区的沉积演化特征与中上扬子板块的构造演化过程息息相关。沉积环境分析是古地理重建的重要内容,黔北地区寒武系黔东统明心寺组沉积环境、沉积演化特征缺乏系统的研究,以致对中上扬子地区明心寺组沉积期的古地理格局的认识不能够统一。因此,本文着重对黔北地区明心寺组的沉积特征、沉积相进行分析,重点厘清明心寺组上段滨岸相的展布范围,为中上扬子区寒武系明心寺组沉积期的古地理重建提
由于电子信息技术日益发展,导致电子产品不断向小型化、多功能化、便携化方向兴盛变化,电子封装材料的发展也进入到新的研究阶段。新型封装材料对材料的性能要求主要包括优异的散热性能、稳定的热膨胀系数、良好的力学性能、优良的耐热性能等。其中聚酰亚胺拥有众多的优异性能,比如:出色的耐高温性能、优异的机械性能和超长的使用周期等,使其成为电子封装材料中最优的基体材料之一,然而其较低的导热性能以及极差的导电性能限制
河流入海水沙变化过程是河床演变、河口地貌侵蚀-堆积以及河流-海洋生物地球化学循环过程的纽带。对河流入海水沙通量变化的研究不仅有助于揭示河流水文过程与河流变化机制,
本次研究以东濮地区奥陶系碳酸盐岩沉积为研究对象,采用层序地层学、沉积学理论为指导,通过对野外露头、岩心、薄片、测井及分析化验资料的详细分析,对研究区进行层序地层划
目的:探究铁过载(IO)及其相关信号通路对骨髓增生异常综合征(MDS)患者间充质干细胞(MSC)功能的影响,揭示铁过载损伤MDS造血微环境的可能机制。内容:实验纳入天津医科大学总医院血液科2017年11月至2019年8月收治的初治MDS患者53例,健康对照者(NC)12例,其中MDS患者根据血清铁蛋白是否大于等于1000ng/ml分为铁过载组(IO)和非铁过载组(NIO)。取上述实验对象无菌骨髓5
视频是人们在日常工作和生活中的重要应用,随着网络的发展以及终端的丰富,直播、转播、远程会议等视频应用不断出现,用户对于视频质量的要求也逐渐提升,高分辨率视频逐渐成为