融合多源特征的致病基因预测方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:YNiit562552379
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
致病基因预测对于推进致病机制的研究起到了重要的作用,是生物信息学研究中的一个重要课题。由于单源生物数据存在的高噪声和高维度问题,极大程度地影响了数据的可靠性。鉴于生物学家通常倾向于整合多源数据来避免偏差,本文对多源特征的融合方式进行了相关研究。具体地,本文从特征融合和模型融合的角度对致病基因的预测问题进行了研究。具体研究内容如下:(1)为了充分挖掘基因-基因关联网络中的拓扑信息,本文构建了基于网络嵌入的深度协同过滤模型(NEDCF),引入了结构深度网络嵌入对基因相互关联网络进行特征提取,并且将特征进行融合后采用引导矩阵补全方法进行致病基因评分预测。由于致病基因预测任务中存在负样本缺失问题,本文引入了PU学习方法进行风险平衡。实验表明,NEDCF模型能够有效提高预测性能。(2)为了从特征角度对多源数据进行融合,本文构建了融合多视图特征的深度协同过滤模型(MVDCF),引入了深度典型关联分析以建模多源数据间的协同性。为了缓解数据稀疏的影响,本文分别构建了基因特征和疾病特征相似图以补充数据。然后采用图卷积神经网络进行特征学习,并引入PU学习方法避免负样本带来的偏置问题。实验表明,MVDCF能够有效改进算法性能。(3)针对传统致病基因预测问题中缺乏负样本的问题,本文构建了基于双图卷积神经网络的深度协同过滤模型(DDCF),引入了基于偏好的模型来避免将无标记样本作为负样本带来的偏差问题。鉴于基于偏好的模型只能学习局部信息,本文提出了基于无监督学习的方法,将其与传统基于点积的方法进行融合,兼顾了全局信息和局部信息。实验表明,DDCF能够有效缓解PU场景下的负样本缺失问题。
其他文献
大多数图像超分辨率(Super Resolution,SR)方法假定低分辨率(Low-Resolution,LR)图像是由高分辨率(High-Resolution,HR)图像通过固定的退化方式(如双三次插值下采样)得到的。但现实世界中的LR图像的退化过程多样,当LR图像的退化方式与SR模型假定的退化方式差异较大时,SR效果不佳。因此,图像盲超分辨率方法是图像超分辨率领域的研究趋势,而在盲超分辨率任
学位
现实生活中有很多场景是用更普遍的图结构进行表示的,如引文网络、蛋白质分子网络、知识图谱等等。传统的卷积神经网络在挖掘图结构数据的特征和模式方面显得无能为力。为了能够在图结构数据上进行卷积操作,研究者提出了图卷积神经网络以解决图结构数据上平移不变性缺失所造成的问题。近几年,图卷积神经网络发展迅速,在用户推荐系统、舆情监控和控制、癌症预测等领域都得到了大量的成功应用。为此,本文在详细研究图卷积神经网络
学位
雾、霾等恶劣天气条件下采集到的图像往往存在对比度衰减、颜色偏差、成像模糊、信息损失等问题,严重影响户外场景监测、视频监控、导航跟踪、目标检测等计算机视觉任务。对有雾降质图像进行恢复和增强以提高场景能见度,复原图像原有细节,对于改善和增强视觉任务在户外场景下的应用性能具有重要意义。传统去雾方法基于统计假设加以先验条件的约束,在现实场景中往往难以泛化。基于深度学习的去雾算法通常依赖大量成对的有雾/无雾
学位
随着碳捕集与封存(CCS)技术的快速发展,由套管腐蚀引发的CO2地层泄漏问题已经成为制约其广泛应用的瓶颈之一。为了评估套管在碳地质封存环境中的腐蚀风险,本文系统研究了碳地质封存套管/水泥界面模拟环境中P110钢的腐蚀规律。首先,通过失重测量和表面分析方法研究了典型地层模拟液中的Cl-浓度、溶解氧浓度和CO2压力对P110钢局部腐蚀的协同影响规律。研究发现,在80℃、10 MPa条件下,当地层模拟液
学位
目的比较术中生命体征变化和顺行性遗忘在咪达唑仑联合舒芬太尼麻醉(咪唑组)、丙泊酚联合瑞芬太尼麻醉(丙泊酚组)支气管镜检查中的差异,探讨无痛清醒支气管镜检查发生顺行性遗忘的影响因素。方法选取2020年1月-2020年3月中南大学湘雅医院110例常规行支气管镜检查的患者,随机分为咪唑组(n=68)及丙泊酚组(n=42),记录两组患者麻醉诱导前(T1)、麻醉诱导后(T2)、内镜经过声门时(T3)、内镜检
期刊
随着生活水平的提高,人们对物品储存的要求更加复杂和严格。如希望能够获得更长的有效保质期;能够在冷冻环境下包装有锋利棱角的物品;包装效果受环境温度或湿度的影响较小等。这就要求包装材料需要有更好的阻隔性和韧性。采用高分子薄膜材料包装物品是一种保鲜储存的有效方式,其中,双向拉伸尼龙(BOPA)薄膜具有优异的力学性能,广泛应用于各种包装领域,但其阻隔性并不突出且吸湿率高,妨碍了包装效果的进一步提高。聚己二
学位
碳纤维增强聚合物电解质复合材料超级电容器将结构器件的承载功能和电源器件的储能功能结合一体,可提高系统整体的结构效率与能量密度,在汽车工业和航空航天领域具有广泛的应用前景。目前,复合材料超级电容器的研究尚处于基础研究阶段,器件储能性能和电解质组分的离子电导率难以满足应用需求,关于电容器及其组分的结构功能相关性与协同调控研究基础薄弱。基于此,本文采用环氧树脂与电解液混溶,利用诱导分相法制备双连续相固态
学位
聚合物先驱体陶瓷转化法(PDC approach)是利用有机聚合物先驱体优异的加工成型性能,经加工成型、交联及热解等步骤,制备陶瓷材料。但先驱体纳米粒子在有机-无机转化过程中,涉及复杂的裂解反应。再加上纳米粒子表面积大,表面未成键电子多,致使其活性大,在热解过程中粒子间容易发生相互反应,生成块体陶瓷。因此使用该方法制备核-壳纳米粒子的报道较少。本论文中使用沥青为隔离剂,以含钴聚碳硅烷溶胶粒子为原料
学位
铝离子光钟跃迁谱线的自然线宽为8 mHz,因此,需要用线宽为1 Hz左右的激光探测光钟跃迁谱线。半导体激光器的线宽为500 kHz,长期漂移量为90 MHz/h,为了满足铝离子光谱探测的要求,将激光频率稳定在法布里-珀罗(F-P)腔上。振动噪声为F-P腔的主要噪声之一,为了降低F-P腔的振动敏感性,理论分析了激光频率稳定的F-P腔振动敏感性。通过有限元方法模拟分析了F-P腔的弹性形变与其形状和支撑
期刊
第三代半导体氮化镓(Gallium Nitride,GaN)具有禁带宽(3.4eV)、抗辐射强、击穿电压高、热导率高等优异特质,在电子、光电子等领域有着不可替代的作用。目前GaN基器件的制造主要采用干法刻蚀,需要应用昂贵的设备和复杂的工艺。简单的湿法光电化学(photoelectrochemistry,PEC)刻蚀可以避免上述缺点,但采用现有的PEC方法加工化学性质极端惰性的GaN不仅刻蚀速度慢,
学位