基于特征选择算法的抗炎肽预测分析

来源 :南昌大学 | 被引量 : 0次 | 上传用户:superzergking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,多肽作为新的诊断药物在治疗人类疾病方面显示出巨大的潜力,其中抗炎肽(AIPs)为自身免疫性疾病和炎症性疾病提供了新的治疗方法。相比于小分子非特异性抗炎药物,抗炎肽具有副作用小和更有效等特点。随着多肽数据的大量涌现,如何准确地识别抗炎肽,对探索抗炎肽内在作用机制和治疗炎症性疾病具有非常重要的意义。虽然越来越多的抗炎肽在传统的实验方法中被验证出来,但是基于实验的方法不仅耗时、费力而且十分昂贵。因此,为了克服传统实验方法的缺点,研究者提出了基于机器学习的计算方法用于预测抗炎肽,这种方法可以更快、更准确地对高通量数据进行识别。本论文针对抗炎肽预测问题,建立了相应的机器学习预测模型,具体工作内容如下:1.基于混合特征选择算法的抗炎肽的预测与分析。为了全面刻画抗炎肽,融合了8种序列特征和4种物理化学特征去编码其信息,然而这使得模型的训练过程变得复杂且困难。特征选择算法能够对高维特征进行优化,得到重要的特征,从而加速模型训练过程、提高模型准确率和增强模型的可解释性。在此,针对抗炎肽预测问题,我们提出一种混合特征选择算法,通过集成增强的过滤式特征选择算法和基于向前搜索的包装式特征选择算法,对融合高维特征进行筛选与优化。最终结合极端随机树(ERT)发展了抗炎肽预测方法PREDAIP(http://github.com/lindan1/PREDAIP)。交叉验证结果显示,相比于融合的高维特征,混合特征选择算法极大地提高了模型的预测性能。与其他现有预测工具在独立测试集上的比较结果显示,PREDAIP是一个可靠的抗炎肽预测工具。2.基于高效的随机特征选择算法的抗炎肽的预测。对于抗炎肽的预测问题,进一步探索新的有效的肽段编码方法。其次我们引入了两种新颖的数据处理技术,即热启动技术(warm start)和冷却技术(cool down),并将其嵌入传统的随机特征选择(RFS)算法中,得到了一种高效的随机特征选择算法。基于基准数据集,考察了6种传统分类器在抗炎肽预测上的性能。最终利用优化后的特征子集,结合随机森林(RF)分类器,开发了新的抗炎肽预测工具PREDAIP2.0。10倍交叉验证结果和独立测试结果表明,PREDAIP 2.0预测性能稳定可靠。该预测工具可为研究者探索抗炎肽内在作用机制和发现新的抗炎肽提供帮助。
其他文献
随着城市规模扩大,公共区域内拥堵、踩踏等突发事件发生概率也随之增加。在多种群体性异常行为中,由摔倒引发的群体恐慌行为往往会引起极为严重的后续后果,除此之外摔倒本身的致死率也极其高。对此本文针对群体行为中重要的多人场景下的摔倒检测进行研究。现有基于计算机视觉的摔倒检测算法存在以下两个问题:问题一是多人复杂场景给摔倒检测造成干扰性大,导致实时性低。现有方法多针对单人简单场景下的摔倒检测,在含有多人的场
说话人识别也被称为声纹识别,是指利用人的特有的声音特性来判别说话人的身份,它作为有效的生物识别技术之一,被应用于实际生活中的众多领域。本文主要研究基于深度学习的说话人识别方法,分别从说话人模型的建立和特征提取两个方面对说话人识别系统进行了研究。论文主要工作如下:1.研究了基于CNN-TDNN混合模型的说话人识别方法。首先利用卷积神经网络(Convolutional Neural Network,C
随着城市的不断发展,其供水管网逐渐发展得庞大而复杂,使用传统人工经验调度的方式将不能精确得把控管网每一个节点的用水需求。如何在保证整个城市对水压、水量需求的前提下使供水费用达到最低是当下的热点研究课题。本文以节约供水费用为目的,以嘉兴市供水管网实际数据为基础,建立了嘉兴市时用水量预测模型、供水管网微观水力模型、两级优化调度模型,在保证整个城市用水需求的前提下降低了供水费用,本文的主要工作如下:用水
本文以机甲大师赛(Robo Master)的全自动哨兵机器人视觉系统为研究对象,在复杂环境和实时性要求下,对敌方步兵、工程、英雄等运动机器人的身份标识符在线识别并进行深度估计。本文主要工作内容有:1.在RGB颜色模型下分析身份标识符的颜色分布情况,修改RGB转YCr Cb颜色模型公式的系数,使用改进的YCr Cb颜色模型对图像进行预处理,凸显目标区域与背景区域之间的差异性。2.针对经典的一维最大熵
当前,大学生职业生涯规划课在高校基本上都有开设,生涯辅导与咨询也基本涵盖了各个学习阶段的大学生群体。本文主要从具体的生涯辅导个案出发结合相关的学习交流经验所得,尝试探讨高校生涯辅导老师在开展相应咨询工作中可能面临的一些困难以及应对之策。
自1960s以来,贵金属纳米材料被广泛应用于生物医学、临床诊断、食品安全以及环境监测等领域。其中金纳米粒子(Gold nanoparticles,Au NPs)因其制备工艺简单、易于生物标记和具有强吸收和强散射的光学性质等特性常被作为生物传感器的标记探针,但传统的胶体金免疫层析方法检测灵敏度偏低,无法满足微量目标物的检测需求。本研究采用微乳液法,以12 nm油胺化的金纳米粒子(Oleylamine
南昌市食用农产品电子化追溯平台是“南昌市食用农产品安全保障水平提升工程”的具体体现,在南昌深圳农产品市场中试点运行。市场从业人员在使用该平台时,需要人工的分辨识别果蔬品种以进行来货报备和交易。人工识别存在判断错误、输入错误、效率低下、消耗大量劳动力等问题,不利于平台的运行。因此,使用图像识别技术开发果蔬图像识别系统用于代替人工识别果蔬品种具有较大的意义和应用价值。本文所研究的内容是基于深度学习技术
基于压缩感知理论的单像素成像技术使用一个单点探测器即可实现二维成像。采用单光子探测器作为单像素相机中的探测器,可将经典的单像素相机扩展到单光子水平,实现了单光子计数压缩成像,与面阵单光子探测器实现的二维成像相比,具有低成本的优势。同时单像素成像系统中的探测器可以收集多个像素的光强,可实现所谓的超灵敏成像。因此单光子压缩成像在荧光成像、生物医学成像、深空探测等极弱光成像领域具有重要的应用。基于传统压
基于压缩感知理论的单像素成像技术以其独特的成像方式受到广泛关注,已应用于生物医学成像、太赫兹成像和高光谱成像等多个领域。采用单光子探测器作为单像素相机中的探测器,可将经典的单像素相机扩展到单光子水平,实现单光子计数压缩成像,具有低成本和超高灵敏度的优势。但单像素成像速度非常慢,限制了其在实时场景的应用。研究获取最有效信息的采样方法以减少测量次数和优化重建算法实现快速图像重建是提高单像素成像速度的两