基于集成学习的关键蛋白质识别研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:w33599589
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键蛋白质对细胞存活来说是必不可少的,鉴别关键蛋白质可以增强我们对细胞工作原理的了解,并且关键蛋白质的鉴定在生物学和药物设计的研究中起着至关重要的作用。当前,研究者们已经提出了一些通过引入有效的蛋白质特征来识别关键蛋白质的机器学习方法和集成学习方法。这些方法使用的有效蛋白质特征是从蛋白质-蛋白质相互作用网络数据中提取出的网络拓扑特征和一些其它的生物学信息特征。但是,这些集成学习方法只是通过简单平均加权将多个基分类器结合起来,它们的研究内容主要是在基分类器的挑选方面。因此,在使用集成学习算法来识别关键蛋白质这一方向仍然有研究的价值。在本论文中,我们研究出了一个新型的集成学习框架Multi-ensemble来识别关键蛋白质。该模型采用了多视图学习的思想,通过集成多个不同的基分类器来提升模型的识别性能。模型中基分类器的训练样本并不是固定不变的,而是由其它基分类器所决定,通过不断添加其它基分类器认为是高质量的样本数据到训练集中来训练基分类器。同时,使用一个新的逻辑回归分类器来集成这多个基分类器,从而得到最后的预测结果。实验数据选择了酿酒酵母数据和大肠杆菌数据。实验结果显示,本论文的方法取得了更好的识别结果。同时,为了更好地鉴别关键蛋白质,本论文在Multi-ensemble模型的基础上增加了特征提取工作。由于胶囊神经网络可以提取出空间特征,因此本论文使用了胶囊神经网络提取出16维特征向量,作为增强特征,将其与原始特征数据结合作为Multi-ensemble模型的输入数据。实验结果表明,添加增强特征后,模型的查全率、查准率和F-Score都提升了12%,准确率提升了5%,AUC提升了8%,能更有效的鉴别关键蛋白质。
其他文献
现代人类社会发展迅速,对各类资源消耗越来越大。陆地资源已经不能满足人类的需求,随着人类对海洋资源开发的进程不断加快,水下无线通信网络的研究变得更加重要。对于目前浅水无线通信网络来说,浅层水面和水下设备的数据传输安全防护等级较弱,仅依靠通信波形及通信协议难以保证通信安全;同时水下通信网络节点硬件部分所用芯片过度依赖国外,同样是信息安全隐患;此外现有水下通信网络节点体积较大、功耗高,仍是水下通信技术所
推荐系统从用户的交互信息中学习用户偏好,生成个性化推荐。但现有的推荐系统往往存在数据稀疏性高、可解释性差、模型训练难等问题。面对这些问题衍生了两种主流的研究方向:一般推荐算法和序列推荐算法。一般推荐算法以协同过滤及其变体作为主要内容;序列推荐算法以基于循环神经网络的方法作为主要内容。其中,序列推荐算法通过考虑用户交互的时序信息,额外考虑了用户偏好的动态变化,更符合现实生活中的实际情况。本文基于现有
随着游客对旅游需求的增长,各地开始逐渐重视起本地的旅游业发展,旅游经济发展占当地经济发展的比重也越来越大。然而在旅游业快速发展的同时也产生了许多环境问题,使旅游地的生态环境日益恶化。地质公园旅游作为近年来新兴的旅游地类型,近年来旅游情况持续火热,但与其它旅游地类型相比,对地质公园生态情况的研究相对较少,因而有必要拓展地质公园旅游生态安全研究。三清山世界地质公园位于江西省上饶市东部,是江西省热度排名
进入21世纪以来,随着控制技术、计算机技术、微型传感器技术、无刷电机技术等领域的迅速发展,多旋翼无人机因具有可空中悬停、垂直起降的优点,能适应于狭小的飞行空间,具有较
审计费用一直是国内外会计学研究领域关注的议题。就已有的文献来看,对审计费用的研究多集中在事务所特征以及被审计单位特征上,近年,随着供应链成为关注的对象,客户特征也逐步被考虑进审计费用影响因素的范畴。学术界已有相当数量文献研究客户集中度,对于其他客户特征的研究较少。本文选择客户与公司之间的地理距离作为客户特征进行研究。中国不同地区的文化特色和发展水平差距不一,同时高铁的快速发展也带动产业经济发展,将
随着网络技术的日益发展,物联网终端设备的大量接入,人们生活方式的智能化转变,使用的终端设备类型和数量也稳步上升。随着5G时代的到来,这种增长趋势会一直延续,并且接入终端的数量和类别在未来的一段时间内都将保持增长的态势。各种终端设备的功能、性能、价格、用户群体都不一样,分析网络终端结构,在一定程度上可以通过数据反应当前用户使用终端的情况和变化。移动运营商可以在此基础上根据用户的终端使用情况开展有差异
耐火衬里和托砖架都是水煤浆气化炉重要的组成部分,耐火衬里起到隔绝高温、蓄热、流场约束以及抗熔渣等作用,托砖架则用于支撑耐火砖的重量,两者均影响气化炉的运行周期和稳定性。炉内高温环境会导致耐火衬里和托砖架热应力过大,造成耐火衬里损坏,托砖架无法支撑耐火砖,因此分析耐火衬里和托砖架的温度和应力分布能有效避免应力集中并优化耐火衬里和托砖架结构。本论文共分两个部分:第一部分研究了气化炉K砖部位耐火衬里及钢
碳纳米管(CNTs)能显著提升复合材料热学性能和力学性能而受到了越来越多的关注,然而,碳纳米管之间强的作用力和聚集的性质,如何将碳纳米管均匀稳定分散到环氧树脂中制备高性能复合材料仍然是一大难题。本文通过硫醇-烯烃点击反应,提出了一种高效制备巯基功能化碳纳米管的方法,制备了不同结构的巯基功能化碳纳米管。功能化碳纳米管在乙酸乙酯和环氧树脂中具有良好的分散稳定性。然后与双酚A型环氧树脂(DGEBA)复合
光电探测器是根据光电效应,将入射光信号转化为电信号进行输出,实现对光信息的采集。本文围绕提高硅基光电探测器响应特性的目标,开展纳米线硅制备、光学性能以及光电响应特性优化等研究,主要获得了以下结果:(1)纳米线硅制备:优化了金属辅助化学刻蚀制备纳米线硅工艺,通过改变镀银时间、刻蚀时间和反应温度等工艺参数,实现了纳米线硅的可控制备。实验确认刻蚀过程中银纳米颗粒存在横向输运,嵌入纳米线硅表面,随退火形成
随着信息技术的发展,大力推进大数据、人工智能等现代科技在检察工作中的应用,实现对检察工作的全程规范化、智能化管理已经成为一大趋势,人们也期待一个可以给大家带来便利的智能问答系统。本文针对检务公开这一特定领域设计了基于自动建库的多策略混合智能问答系统,以人机对话的形式回答用户提问的有关检察院办事流程、法律法规、案件法律咨询等问题,返回的答案一般唯一且比较准确,不需要用户再次进行筛选,大大节约了用户的