基于矩阵完备化的lncRNA-疾病关联预测研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:Monkeysct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,越来越多的生物学实验和临床报告表明,长非编码RNA(lncRNA)在生物体RNA中占有很大比例,在细胞生长发育、基因表达调节、替代剪接、核组织等各种生物过程中起到关键作用。lncRNA异常表达或功能障碍与各种复杂的人类疾病密切相关,因此预测lncRNA-疾病的关联对疾病的诊断和治疗是必要的。lncRNA和人类复杂疾病的数目繁多,而验证lncRNA-疾病之间相关性的生物实验耗时周期长且昂贵,所以开发有效的计算模型对生物信息学领域发展有重要意义。针对以上问题,本文主要完成的工作如下:1.将lncRNA-疾病关联预测问题看作是推荐系统问题,本文提出一种矩阵完备化的lncRNA-疾病关联预测方法(MCLDA),MCLDA首先分别计算lncRNA和疾病的两种不同类型相似性并进行网络融合,之后分别用主成分分析提取出lncRNA和疾病相似性的主要特征向量矩阵。对于新的lncRNA,根据其邻居的相互作用来重写lncRNA-疾病邻接矩阵从而解决冷启动问题。最后基于矩阵完备化模型框架完成关联预测。2.考虑到功能相似的lncRNA包含相似的关联模式,表型相似的疾病具有相似的关联模式,它们是关联邻接矩阵当中lncRNA和疾病的内在结构,本文提出了一种基于正则化的矩阵完备化的lncRNA-疾病关联预测方法(MCRLDA)。MCRLDA运用流形学习,将矩阵内在信息视为引入基础结构的正则化项,结合lncRNA关联模式和疾病关联模式的近似度来恢复与完备关联矩阵。本文提出基于矩阵完备化的lncRNA-疾病关联预测方法,实验结果表明MCLDA和MCRLDA的预测性能都优于之前的一些公开预测方法。为了进一步验证模型性能,本文对几种人类重大疾病进行了相关案例分析。
其他文献
苦豆子(Sophora alopecuroides L.)又名布亚(维名),为豆科槐属多年生草本植物。在我国主要分布于新疆、内蒙古、山西、陕西、宁夏、甘肃、西藏等地区。其种子是维吾尔族人常用的民间药材,具有解毒、抗菌、抗炎、镇痛、平喘、抗肿瘤等多种药理活性,可以用来治疗小儿湿疹、银屑病、菌痢、慢性肠炎、病毒性肝炎、前列腺炎、妇科霉菌性炎症及宫颈糜烂等疾病。本文对苦豆子化学成分和生物活性的研究现状进
原花青素也称缩合单宁,是植物中一类重要的次生代谢物质,可以帮助植物抵抗多种生物和非生物胁迫,并且在人体中可以作为天然的抗氧化剂,其含量对作物品质和人类健康具有重要影响。原花青素在植物中的合成与分布具有严格的组织特异性,尽管其与花色苷同属于类黄酮合成途径,且共用了大部分生物合成过程,但一定存在精细的调控网络分别控制着它们的合成与积累。目前,针对原花青素的研究主要聚焦在双子叶植物的营养器官和果实中,而
苦豆子(Sophora alopecuroides L.)别名为苦豆草、苦甘草,属于豆科槐属草本植物,主要分布于我国甘肃、宁夏和新疆等地区。主要含有生物碱、黄酮、香豆素等化学成分。其为我国新疆哈萨克族的传统药材,主治湿热痢疾、妇科炎症以及皮肤瘙痒等疾病。本实验对苦豆子地上部分化学成分进行了系统研究。以干燥的苦豆子地上部分为材料,采用70%乙醇热回流提取方法进行提取,提取物按极性依次萃取,对不同极性
采用硫酸镍作为化学镀镍镀液的主盐,直接在铸造法制备的镁合金AZ91基体上进行化学镀镍,并对镀层进行腐蚀试验、形貌观察和能谱分析。结果表明,镀镍沉积速率随着施镀时间的增加而增大再减小,镀镍时间为1 h时镀速达到1.42μm/h。在3.5%Na Cl溶液中浸泡4 h后,镀镍镁合金AZ91的腐蚀速率随着施镀时间的增加而减小,镀镍时间为1 h的镁合金腐蚀速率最小,为0.063μm/h,比未镀镍镁合金的腐蚀
细胞衰老是指细胞脱离细胞周期并不可逆地丧失增殖能力后进入的一种相对稳定的状态,是正常细胞的必然归宿。细胞衰老的过程会伴随着包括细胞周期停滞、染色质结构改变、分泌表型改变以及通透性降低和胞内物质沉降等多种改变。癌基因RAS等多种诱因诱导的细胞衰老伴随着衰老相关的异染色质凝集(senescence-associated heterochromatic foci,SAHF)的产生,是细胞衰老的一个重要的
财富是人类生存和发展过程中不可缺少的东西,是人类一生追求的重要目标。在人类社会发展过程中,人们渴望财富、创造财富、拥有财富和享受财富。与此同时,人们也对“财富是什么”,以及“是什么创造了财富”与“财富应该如何分配和消费”等问题形成了一些基本的认识和观点,这就是财富观。财富观是一个历史的范畴。在当代中国发展语境中,人们的财富观是不断演变、深化和发展的。近年来,与市场经济发展相伴而生的资本逻辑,开始对
在矫治颅面部错(牙合)畸形方面,(牙合)平面的作用非常突出,是评估矫治成功与否的关键标准之一。(牙合)平面偏斜主要表现为两侧(牙合)平面不在同一水平位置。其形成原因复杂,研究表明,(牙合)平面偏斜与咬合力、咬合接触面积、咀嚼运动、颞下颌关节形态,甚至头颈姿势位有关。常见(牙合)平面偏斜与下颌偏斜关系主要为同侧偏斜,也有少部分患者为对侧偏斜。临床上非手术矫正(牙合)平面偏斜一直是治疗难点。本文就(牙
长链非编码RNA(long non-coding RNAs,lncRNAs)是一类长度超过200个核苷酸的非编码RNA,研究表明lncRNAs能够在多个层面调控基因的表达水平。近些年的研究发现lncRNAs参与了肝脏糖脂代谢调控,并在糖尿病表型中起着重要的调节作用,对lncRNAs进行更深的研究或许可以使其作为分子标志物或使糖尿病及其相关并发症的治疗应用成为可能。然而,关于Glucagon诱导的l
G蛋白(guanine nucleotide-binding proteins),又称为GTP结合蛋白,是具有GTP水解酶活性的一类信号转导蛋白,定位于细胞质膜内侧。三聚体G蛋白(Heterotrimeric G protein)是由α、β、γ三种亚基组合形成,每种亚基又有多种亚型,不同亚型间的组合及其下游效应决定了G蛋白功能的多样性。在5种Gβ亚基中,Gβ2在发育中的大脑皮质中高度表达。我们实验
公安部公布的数据显示,2020年我国汽车保有量高达3.72亿辆。机动车驾驶人达4.56亿人。如此巨大的汽车数量,使得交通事故发生的频率居高不下,根据国家统计局近三年发布的《中国统计年鉴》数据统计,我国交通事故年均死亡人数6.3万,交通事故发生数23.19万次。在这些交通事故中,有超过两成是由疲劳驾驶引起的,因此设计并实现一个高效的疲劳检测方法对预防疲劳驾驶有着重要意义。本文使用计算机视觉技术,设计