基于多源数据的miRNA调控模块识别算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:sc13859315118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物科技的迅猛发展,大量生物组学数据的出现,为研究生物分子功能提供了有力的支撑。如何利用这些生物数据挖掘出人类所需的信息成为研究人员前所未有的挑战。结合miRNA调控关系和蛋白质相互作用关系来识别miRNA调控模块,对于理解复杂生物系统中的分子组合效应、揭示导致复杂疾病发生的重要的miRNA和靶基因具有十分重要的意义。针对目前大多数miRNA调控模块识别算法需要提前设定模块数目这一问题,本文提出一种基于多类型数据的miRNA-mRNA调控模块识别算法MiRMD(miRNA-mRNAregulatory modules detection)。该算法首先通过整合表达谱数据、绑定位点信息等创建miRNA调控网络,然后检测该调控网络中联系紧密的核结构,再通过给各个核添加满足相应要求的miRNA和mRNA来扩充成为调控模块,最后过滤掉重叠率较高的模块。通过在三种癌症数据集上的实验发现相对于其他两种算法,MiRMD识别出的模块具有更好的MiMEC(miRNA-mRNA expression correlation)值和更加显著的GO富集性。而且MiRMD能识别出与癌症有着密切联系的模块。针对MiRMD算法主要是从单个miRNA与多个mRNA组成的模块出发进行核结构检测并进行重叠邻居拓展得到最终的miRNA调控模块,而没有对miRNA集合与mRNA集合之间的集体联系进行分析研究。本文中提出了一种基于miRNA集合与mRNA集合之间集体关系的miRNA调控模块识别算法CGR(collective group relationships)。该算法首先利用LASSO模型整合多数据源来构建加权miRNA调控网络,然后基于此构建加权的miRNA协同作用网络并对miRNA进行聚类,形成miRNA簇;再在蛋白质网络上对mRNA进行聚类,形成mRNA簇,最后通过miRNA和mRNA之间的调控关系,将联系紧密的miRNA簇和mRNA簇进行合并,得到最终的miRNA调控模块。在三组数据集上的实验表明该算法能识别到效果更好的miRNA调控模块。
其他文献
干旱胁迫是当前全球面对的重要环境问题之一,全世界土地面积中,约34%的区域处于干旱和半干旱状态,在中国这一比例接近50%,水分的缺乏直接影响作物产量的提升。所以改良和提高
随着第三代红外探测器技术的不断发展,红外成像系统的性能得到了极大的提升,但是,在实际的调试和测试过程中会对红外成像系统造成一定的磨损和消耗,因此红外成像系统模拟器的
植物释放的化感物质与其根际土壤微生物相互作用最终决定植物化感潜力已成为当前普遍认可的学术观点。前期研究发现,水稻第2号染色体上的PAL基因(PAL-2)是化感水稻PI312777酚酸
内切木聚糖酶[EC 3.2.1.8]能够打断木聚糖内部的β-1,4糖苷键,催化降解木聚糖。该酶广泛应用于造纸,食品,饲料,纺织以及能源等行业。目前已经从自然界中分离到的酶,以真菌类
多环芳烃(简称PAHs)是一种由2个和2个以上的苯环以线形排列、弯接和簇聚方式构成的有机化合物,主要由煤、石油和天然气等不完全燃烧产生,在环境中分布广泛。PAHs在环境中具有较
当今人类面临环境恶化以及一次性能源日益枯竭两大问题,传统能源产生的温室气体CO2对环境构成了严重的威胁。因此利用可持续的太阳能将CO2转化为燃料资源如甲醇是许多科学家
20世纪80年代,美国工程师Geiger提出了一种新型、实用的大跨度空间铰接体系,即索穹顶结构。索穹顶具有受力合理、自重较轻、成本较低、外形美观等特点。近几十年来,索穹顶的
永磁同步电机(Permanent Magnet Synchronous Motor,PMSM)是一种通过永磁体产生同步旋转磁场的同步电机,具有结构简单、效率高、发热小等特点,在工业、交通和家用电器等领域
我国是一个秸秆类生物质资源十分丰富的国家,这部分资源得不到合理的利用会造成严重的环境污染和资源浪费,将农作物秸秆厌氧发酵产气是秸秆资源化利用的一种有效途径。但秸秆
聚苯硫醚是一种性能优异的特种高分子材料,具有很高的热稳定性、耐化学腐蚀性、阻燃性、良好的加工性能及可掺杂性。本课题旨在探寻低毒或无毒的高效掺杂剂,对聚苯硫醚纤维进