RNA序列的模式识别与功能预测方法

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:crm888crm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因测序技术如RNA-seq(高通量转录组测序技术)的飞速发展,研究人员已测定出人类全部的RNA序列。海量的人类RNA序列中存在着不断重复的序列片段,这些相似性极高且不断重复的序列片段就称之为RNA序列中的模式(motif)。每个RNA序列模式执行着类似的生物学功能,包含着大量有价值的生物信息。由于RNA序列数据量极大,如何系统地从序列中挖掘出序列模式以及如何预测模式的生物学功能是一个困难的问题。本文通过设计算法挖掘出RNA相互之间的关系,找出它们共享的RNA模式片段,再通过一系列统计分析预测出RNA序列模式的生物学功能。大体可分为如下两方面工作:1.基于RNA序列相似性的模式识别方法。由于RNA之间分享一些相似的RNA序列模式,其统计显著性远超随机字符串序列的相似性,本文采用以包含人类全部RNA的GENCODE数据库作为数据集,通过设计递归式成对序列比对算法(RAP算法)、RNA相似片段的聚类算法以及RNA模式去冗余性贪心算法,挖掘那些在RNA序列中频繁出现的模式片段。2.预测RNA序列模式的生物学功能。通过RNA序列的模式识别找到那些在RNA序列中频繁出现的模式后,结合GENCODE、Uni Port KB、Gene Ontology三大生物信息数据库和相关工具集,设计出从RNA序列模式映射到基因功能的算法框架,通过统计分析的手段预测RNA序列模式的生物学功能。系统的实验表明,本文提出的方法实现了既定目标,总计识别出218条RNA motif,并对其中若干条RNA motif的生物学功能做出了可靠预测。
其他文献
本文结合J检测公司的泡沫涡流检测器的特征检出率的实际现状,用排列图方法分析找到泡沫涡流检测器特征检出率低的诸多影响因素,并用关联图详细分析并找到其影响原因,通过单因素方法分析出影响特征检出率的主要因素,最后通过正交试验设计,确定主要因素对泡沫涡流检测器特征检出率的影响程度和显著性。首先根据单因素方法分析得出提升泡沫涡流检测器一次特征检出率的方法,提升探头覆盖面积,降低泡沫覆盖层厚度,控制运行速度,
由于我国的油气资源分布不平衡,油气输送需要建设大量管道,目前管道建设中多采用焊条电弧焊、半自动焊接方式,全位置管道自动焊接技术使用相对较少,而管道自动焊接技术具有焊接效率高、焊缝成形好、焊接质量高等优点,所以目前油气管道的铺设中逐渐采用自动焊接技术取代手工焊接和半自动化焊接。因此,为了提高油气管道焊接的生产效率和焊缝的成形质量,有必要开发结构紧凑、重量轻、稳定性高的全位置管道自动焊接系统,以满足当
碳化硅颗粒增强铝基(SiCp/Al)复合材料以其高强度、高耐磨性和低热膨胀等突出特性,广泛应用于航空航天和军工等关键制造领域。SiCp/Al复合材料加工过程中刀具-颗粒-基体的相互作用会导致工件材料产生严重的亚表面损伤。这不仅会加剧裂纹的萌生和扩展,还会极大降低材料的疲劳性能,限制其可靠性应用。因此,研究SiCp/Al复合材料切削亚表面损伤特性及其对材料力学性能的影响,对提高该材料零件在关键领域的
改革开放以来,有了市场经济的推动,中国消费者从不看重品牌到现在越来越多的消费领域都具有强烈的品牌意识,很多中国品牌从本土成长并走出国门,开始走向国际化,比如联想、华为、海尔、TCL、中国石化等,让中国品牌的声音越来越响亮;但是,也有很多中国本土品牌曾经叱咤风云,妇孺皆知,但是却因种种原因走向没落,象流星一样淡出了人们的视线。
期刊
上海手表七厂为扩大本厂“金菱”牌定时器的影响,为消费者提供良好的服务,在厂门口开设“金菱贸易公司”。该公司经营范围虽然比较广,但仍以经销定时器与本行业的钟表为主。具有三个特点:(一)提供的定时器品种齐全,便于消费者选购。按定时时间分,有1分钟至180分钟等7个品种;按功率分,有1.6安培、6安培等;还有正接点
期刊
直接合成不存在已知三维(3D)层状母体的二维(2D)范德瓦尔斯(van der Waals,vd W)材料将为开发具有新特性和新功能的工程材料提供重大的机遇。最近实验合成的在2D材料发展进程上具有里程碑意义的Mo Si2N4化合物,一种新型的直接合成的2D vd W层状材料,正在吸引着光电子学、谷电子学及自旋电子学等领域的关注。尽管最近对单层Mo Si2N4的理论探索越来越多,但迄今为止关于缺陷对
深海投弃式温盐深剖面仪(Expendable Conductivity Temperature and Depth Profiling System,XCTD)近年来在海洋水文数据测量中已被广泛的应用,其具有低成本、实时、大面积等特点。但由于XCTD信道应用的特殊性,其具有时变、低信噪比的特点,且随着探测深度的增加,信号的幅值衰减极大,降低了信号的传输性能。因此本文针对提高XCTD信道传输特性这个
RNA干扰(RNA interference,RNAi)技术为致病基因的序列特异性沉默提供了一种可行的策略,具有广阔应用前景。研究发现小干扰RNA(small interfering RNA,siRNA)是触发RNAi的效应分子,若将siRNA作为一种潜在的治疗药物需要解决两个问题。一个问题是估计siRNA的逃逸量,为设计能够有效地将siRNA以临床剂量导入到对应靶细胞的细胞质中的试剂提供指导。另
随着全球的快速发展、人口数量的提升以及工业的增长,人类对淡水的需求急速增长,而淡水资源的缺少已经成为了各个国家或地区最严重的问题之一。反渗透海水淡化作为解决淡水资源短缺的有效途径,一直受到各个国家的高度重视。而对于反渗透海水淡化工程,动力系统采用的高压泵多依赖进口且耗费大量电量,增加了淡化成本,同时结构复杂、噪声大。为了解决以上问题,研究提出了一种新型外部加热的反渗透海水淡化增压泵结构,简化了传动
艾里脉冲传输特性是一项激光研究领域有意义的课题。与通常所用的的高斯或双曲正割脉冲等相比,艾里脉冲有与它们不同的性质,它有群速度自加速、近似无色散和自愈三个特性。这三个特性导致脉冲在传输过程中呈现出新的特征,也为激光调控提供了一条新的途径和思路。本文通过MATLAB对艾里脉冲进行模拟计算,利用分步傅里叶算法,研究了艾里脉冲传输的动态过程。本文主要研究内容与结果如下:1.通过输入含有初始啁啾高斯形脉冲