基于增强归纳型矩阵补全的基因—疾病关联关系预测研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:pinghua_xu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量测序技术以及计算机技术的快速发展,各种各样的生物数据呈爆发式增长。面对海量的生物信息,如何高效探索基因-疾病关联关系也成为了当前生物医学领域的一个研究热点。精准的基因-疾病关联关系预测可以帮助研究者揭秘致病基因功能,并为疾病的防治提供帮助。国内外研究者已经针对该问题提出了诸多的预测算法,并取得了一定的研究进展。然而,这些方法都忽视了一些基因和疾病数据所固有的先验信息。同时,受诸多因素的影响,现有的基因和疾病数据库并不完善,这也导致了基因-疾病关联数据稀疏以及关联数据偏斜,在设计预测算法时经常会遭遇数据稀疏问题和PU(Positive and Unlabeled)学习问题。针对上述问题,本文引入矩阵补全理论进行预测算法设计,将基因-疾病关联关系预测问题建模为归纳型矩阵补全问题,并从两个不同的角度提出了两类增强归纳型矩阵补全模型。首先针对先验信息利用不足问题,提出一种融合先验信息的增强归纳型矩阵补全模型,利用先验稀疏正则化来保持基因-疾病关联数据的先验稀疏性,同时利用流形正则化技术来保留基因和疾病的关联一致性信息。实验结果表明,该算法融合这类先验信息能够有效提升预测效果。此外,针对数据稀疏和PU学习问题,提出一种基于Katz增强归纳型矩阵补全模型,该模型由基于Katz方法的预估计和基于归纳型矩阵补全方法的精化估计两步骤组成。具体地,先利用Katz方法基于基因-疾病异构网络对关联关系进行预估计,以期缓解关联数据稀疏和PU问题的影响;然而,受制于相似度网络的质量,Katz方法在预估计基因-疾病关联时不可避免地会引入一些噪声,为此,将弹性网正则化技术引入传统的归纳型矩阵补全模型以增强其鲁棒性,进而用改进的归纳型矩阵补全模型来精化基因-疾病关联预测效果。实验结果表明,该算法的预测效果相较于之前提出的预测算法有显著的提升。最后,本文提出的两种增强归纳型矩阵补全模型集成了基因和疾病的特征信息,都能够有效地解决基因-疾病关联关系预测中常见的冷启动问题。
其他文献
钦州坭兴陶作为中国的四大名陶之一,虽然经过千年的传承与发展,但其现状却与成就不相匹配,目前大多数的坭兴陶产品在造型和装饰上都以传统古朴形式居多,创新能力薄弱,在激烈的市场竞争中,以无法满足消费者对产品多元化的感性需求。如今随着世界范围内文化创意产业高速的发展,坭兴陶文化创意产品也应运而生,由于其目前还处于初始阶段,还普遍存在着产品造型及文化元素同质化严重,难以满足使用者的感性需求、装饰上更多注重坭
目的:利用皮肤老化状况代表日光暴露程度,并以此衡量机体长期维生素D水平,进一步探讨其与认知功能之间的关系。方法:本研究采用整群随机抽样的方法,选取辽宁省沈阳市郊区60岁
目的:大动脉炎(TA)是一种慢性主动脉及其主要分支的非特异性炎症,病变常累及血管壁全层。主要病理特征为浆细胞和单核细胞浸润。其中头臂型大动脉炎(BCTA,又称主动脉弓综合征
目的:抵抗素(Resistin,RETN)是2001年Steppan在研究胰岛素增敏剂(噻唑烷二酮类药物)的作用机制时发现的一种脂肪细胞因子,与肥胖、胰岛素抵抗和2型糖尿病相关联。抵抗素除参
本研究利用华南农业大学以日本晴为受体转化药用野生稻抗逆相关TAC克隆获得的栽培稻材料,包括:1、转化随机TAC克隆获得的高世代(T10)TDF系列稳定株系和低世代(T3-T5)TR系列材料;2、转化基于DREB保守序列筛选的TAC克隆高世代(T10)D系列稳定株系;3、分别转化基于NBS-LRR、STK和NAC保守序列筛选的TAC克隆获得的低世代(T3-T5)NBS-LRR系列材料、STK系列材料
随着我国经济迅速发展,工业、生活废弃物处置不当,化肥和农药使用过量造成农田土壤破坏严重,土壤重金属污染、板结、肥力下降等问题层出不穷。微生物菌肥可以通过自身代谢活动,改善土壤结构,增强土壤肥力,促进植物生长,防止植物病害。常与化肥混施,应用十分广泛。本研究从玉米根际、微生物菌肥、重金属污染土壤中分离筛选得到6株优良植物促生菌(Plant growth promoting rhizobacteria
水稻高产优质栽培是近年来研究的热点,因城乡经济的发展,劳动力群体的变化,栽培技术的突破提高,促使直播稻研究的快速发展。本研究以中熟半直立穗型水稻品系沈稻702为试材,试验采用二因素裂区设计,主区为栽培方式,包括旱直播和移栽2个水平;裂区为产量水平,包括基础产量(BY)、农户产量(FY)、高产高效产量(HH)和超高产产量(SH)4个水平,研究分析北方粳稻在不同栽培方式及肥力水平下的产量及其构成因素实
稀土钡铜氧REBa2Cu3O7-δ(RE为稀土元素,REBCO)高温超导体由于具有很高的不可逆场(Hirr)和在高磁场下较高的临界电流密度(Jc),具有很好的应用前景。为了满足强磁场领域应用的需要
氮元素是作物生长发育所不可缺少的大量元素之一。因而,基于化肥工业和矮化育种的第一次绿色革命,使得作物的产量得到了空前的提高。然而,与此同时大量或过量施肥带来了很多问题,诸如作物氮素利用率下降、土壤板结、环境污染等等。因此,农业上一方面急需减轻对氮肥的依赖,另一方面又要保证作物的产量,这种矛盾日益突出。而培育和种植耐低氮作物品种可以有效解决以上问题。然而,植物耐低氮的表型鉴定和分子机理都非常复杂,到
背景慢性心力衰竭(chronic heart failure,CHF)的发生与心肌能量代谢的改变相关。磷酸肌酸作为一种天然高能磷酸化合物,可在缺血缺氧状态下维持高能磷酸盐池于恒定水平,使器官免受损伤,其在CHF的治疗中的疗效及机制有待进一步探讨。目的分析磷酸肌酸对不同病因慢性心力衰竭的疗效。方法收集2017年7月至2018年9月在鹿邑县人民医院心血管内科住院的心力衰竭患者180例作为研究对象。随机