基于多源数据融合的蛋白质功能预测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lzhonline276
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,生命科学和信息技术飞速发展,为基因和蛋白质等基础研究提供了动能。蛋白质参与到生物活动的方方面面,其相关研究对于揭示生命密码具有关键作用,是当前生物信息学领域的研究核心,也是未来精准医学的关键支撑。基因本体项目归一化了不同物种的蛋白质功能,每一个功能都由一个本体术语来描述,术语之间具有父子关系。在高通量测序技术迅速发展的今天,每时每刻都有新的数据诞生,其中包括大量的蛋白质序列数据和蛋白质互作用数据。然而,这些蛋白质中大部分功能是未知的,因此使用某种办法测出或者计算出未知蛋白质的功能,将会极大促进蛋白质组学的发展,对药物研发也是强力的推进。基于生物学实验的方法在测定蛋白质功能时开销很大,并且需要专业的生物学知识,基于深度学习来标注蛋白质的策略应运而生。现有的深度学习方法在解决这类问题时往往只考虑蛋白质序列,忽视了蛋白质-蛋白质互作用网络对蛋白质功能的约束作用,反之亦然。另外,在使用网络表示学习处理蛋白质互作用网络部分模型采用的是通用类型的嵌入算法,并不契合互作用网络本身的特性。不仅如此,大部分序列模型在表示蛋白质时仅仅采用独热编码来表示氨基酸序列,同时采用浅层的神经网络模型来提取特征,无法捕捉序列的复杂性质。本论文针对上述的局限性,进行了以下几个方面的工作。第一,构建蛋白质-蛋白质互作用网络,结合网络的特性来改进现有的网络嵌入算法来获取每个蛋白质的数学表示。第二,采用类似获取单词表示的方法来生成氨基酸子串的表示向量,进而获取蛋白质的矩阵表示。同时改进序列模型,以生物学知识为指导,构建全新的深度学习模型提取蛋白质序列的关键特征,将该特征和蛋白质-蛋白质互作用网络的数学表示结合起来作为蛋白质的总体特征进行预测。在人类和老鼠等数据集上的实验结果表明,本论文的方法在接受者测试曲线下面积等指标上取得了目前已知结果中的最优。本文在蛋白质功能预测课题中融合了蛋白质序列和蛋白质-蛋白质互作用网络数据,在获取网络的嵌入表示时从蛋白质网络的特性入手,改进现有的嵌入算法,使得该相似的蛋白质具有相似的数学表示。同时,在使用深度学习模型获取蛋白质序列特征中参考了生物学知识,这种以领域知识指导的深度学习模型对其他领域也具有重要的参考意义。
其他文献
机电伺服系统的动态跟踪精度受到结构不确定性(参数波动)和非结构不确定性(未建模动态、外部干扰、非线性摩擦)的影响。自适应鲁棒控制是一种解决不确定性控制问题的先进控制方法,在很多领域都得到了应用,然而当动态跟踪精度要求较高时,该方法由于对扰动辨识精度不够精确,导致系统的动态跟踪精度不理想。扩张状态观测器在自抗扰控制中,用于观测扰动。本文以机电伺服系统为研究背景,提出一种基于扩张状态观测器的自适应鲁棒
随着永磁同步电机(PMSM)驱动系统在家用电器领域的广泛应用,对高可靠性与低成本化的需求日益增加。传统的矢量控制系统需要三个相电流传感器以及一个固定在电机转子轴端的位置传感器进行闭环矢量控制,过多的传感器不仅增加了系统的成本,传感器预留位也增加了系统的体积,并且降低了驱动系统在恶劣工况下运行鲁棒性。为了提高家用电器的市场竞争力,单电阻电流重构技术受到了广泛重视。与此同时,不依赖位置传感器获取转子位
核聚变能源具有储量丰富和能源本身清洁可持续等诸多优点,具有较高的军事与社会价值。激光约束聚变是实现受控核聚变的主要方式之一,腔靶作为激光聚变实验的主要操作器件,其制造与装配精度是影响实验成功的关键因素。目前的腔靶装配方式多为人工装配或半自动化微装配系统装配,装配效率不高,且灵活性较差,为实现激光聚变腔靶的高效灵活装配,本文对双操作手协调装配腔靶的运动规划开展相关研究。首先,通过对激光聚变腔靶对接装
工业4.0的提出,在全球范围引发了一场以智能制造为核心的工业革命。智能维护是智能制造的重要组成部分,刀具的健康状态监测是智能维护的重点研究对象,如果刀具磨损超过相应指标却未及时更换,则会造成时间经济等方面的损失浪费,由此可见,预测加工过程中刀具的磨损量有重要意义与价值。目前车间内可以获得数据越来越多,数据呈现多元异构的特性,而传统刀具健康监测技术所采用的浅层机器学习难以将其全面利用。此外,在实际加
在全球提高制造业的自动化水平背景下,机器人通过传感器自动识别焊缝的位置完成焊接对提高焊接的自动化水平有着重要的意义。本文提出了一种基于立体视觉对焊缝进行三维重建并规划机器人焊接路径的方法。该方法适用于各种尺寸,各种角度放置的V型对接坡口焊接工件,对三维重建过程中噪声的抗干扰能力强,鲁棒性好。本文首先进行了硬件设备搭建和点云采集工作。采用了Kinect深度相机对工件进行三维建模,并以点云的方式输出,
随着老年人口数量的增加,平衡障碍的发病率呈上升趋势。许多老年人由于头晕而摔倒,头晕导致平衡失调,存在很严重的安全隐患问题。平衡失调问题目前是医学界人士关注的焦点,是医学领域亟待解决的问题。我国平衡失调患者逐年增多。但医疗资源十分有限,康复训练方法单一,技术落后。本课题以平衡障碍患者康复训练机器人为研究对象,开展研发的相关工作。人体平衡障碍的成因很大一部分原因是运动感知系统异常,尤其是前庭感知系统功
压电-摩擦电能量转换技术可将机械能转换为电能来为电子元件供能,或者作为自供电传感器使用来检测人体的生理状态。本文应用MEMS工艺中的掺杂和薄膜技术制备了纳米复合电极,利用这种电极设计出检测人体脉搏和步频信号的可穿戴传感器。本文通过无场、温度场、紫外线场、磁场和复合场等物理场测试和人体穿戴实验对这款传感器的性能进行探究。研究了Polyvinylidene Fluoride(PVDF)材料的压电效应,
海洋对人类生存意义重大,“十四五”规划将深海探测列为科技创新领域十大重点研究方向之一,随着深海探测迅速发展,迫切需要一种性能出众的海底探测与作业设备。传统推进器式、履带式、仿生式探测设备受水流影响大,存在定点作业困难、环境扰动大等缺点,水下足式机器人出现可有效解决上述问题。但受水流、坡度、泥地等因素影响,海底行走更容易倾覆、打滑失稳,如何使机器人海底稳定行走,是足式机器人在海底成功应用的关键。本文
模块化机器人由多个具有相同结构和通讯方式的基本模块单元组成,具有构型灵活多变、互换性良好的特点。外肢体机器人作为一种新型的可穿戴机器人,可以通过穿戴的方式固定在使用者身上,作为额外的机械肢体协助穿戴者完成一系列复杂、高强度的作业任务,具有良好的应用前景。本文将两者的概念相结合,利用一种链式构型的模块化可重构机器人组成外肢体机械臂,构成模块化外肢体机器人,使其可以灵活切换构型,具备较强的适应性。本文
重大基础设施工程是关乎社会民生、改善区域经济发展的大型公共基础设施项目,在新型城镇化、“一带一路”倡议及可持续发展的时代背景下,我国的重大基础设施工程正在迅速发展,相关主体在其建设和管理方面也积累了丰富的经验。重大基础设施工程在技术应用、组织管理、环境协调等方面具有复杂性和关联性,极易导致阻碍项目建设的风险事件发生,引发社会民众和政府的关注。本研究以重大基础设施工程为研究主体,对项目建设期间面临的