基于SAM-Voting的先兆子痫预测研究

来源 :东北林业大学 | 被引量 : 0次 | 上传用户:chung51
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗水平的不断提高,医疗大数据背后隐藏的疾病信息逐渐引起人们的关注。先兆子痫是一种常发生在孕产妇群体妊娠期的疾病,严重危害着孕产妇的身体健康,现阶段一般通过血压和蛋白尿进行诊断,但存在一定的误诊率。因此,借助医疗大数据、机器学习,在众多的基因属性中筛选出适合的属性以及提高预测模型的准确率是解决当前先兆子痫误诊率的重要手段。本文结合先兆子痫基因表达量数据集,通过SAMVoting模型预测孕产妇是否患有先兆子痫。论文的主要研究内容如下:针对原有的SPAARC算法中出现的离散属性中拆分属性会偏向选择取值种类较多的属性,在连续属性中拆分出的叶子结点误差较大,从而会降低模型的预测能力和准确性等问题。本文提出SSG-SPAARC算法,该算法使用样本取值作为拆分点,引入惩罚项,应用Taylor公式,在削弱属性偏向的同时,减小了使用样本中点拆分带来的不准确性,从而避免了分类的误差。实验表明,SSG-SPAARC的准确率方面优于SPAARC,并具有良好的泛化能力。通过差异分析法以及CFS算法在先兆子痫基因表达量数据集中筛选出13个基因,将SSG-SPAARC算法利用先兆子痫数据集进行训练和比较。实验表明,SSG-SPAARC在预测先兆子痫的TNr、FPr、TPr、FNr以及准确率上优于SPAARC。为了进一步提高先兆子痫预测的准确率,使用SSG-SPAARC算法、Adaboost以及多层感知机结合软投票策略提出SAM-Voting模型。实验表明,在预测先兆子痫上,SAM-Voting模型在AUC及以上指标上均有了显著的提升,达到了疾病预测的目的。构建了基于SAM-Voting模型的先兆子痫预测工具。工具包括用户管理、用户数据管理、权限管理以及先兆子痫预测管理四个模块。该工具可以对患者基因检测获得的基因表达量数据加以分析预测,可以作为先兆子痫疾病医疗预测的辅助工具,为孕产妇在先兆子痫疾病的筛查提供良好的诊疗方式。
其他文献
随着气候的不规律变化和生态环境的破坏,干旱对农林业生产的影响越来越大。通过栽培抗旱的植物种类,合理利用旱田发展潜力巨大。拟南芥是植物遗传学、发育生物学、分子遗传学的研究的好材料,被誉为植物中的果蝇,因此在植物抗旱领域的研究里,拟南芥发挥着重要的作用。目前研究者们开展了大规模研究用以推断不同基因对植株耐旱功能的影响,并采用各种方法培育具备耐旱能力的植株。其中包括推测蛋白质是否具备耐旱的功能,以此帮助
学位
能源是人类社会发展的推动力,科技与社会发展的数次变革都与其密不可分。面对当前国际能源与环境问题,新型可再生清洁能源的开发和利用被广为关注,特别是生物质能因储量大、来源广泛、再生速度快和整体零排放等特点被认为是极富潜力推进国家“双碳”战略达成的重要可再生清洁能源。在诸多生物质转化利用技术中,水热液化制备液体燃料技术因特别适合于含水量高的生物质,近年在藻类生物质、高含水的陆生植物性生物质及高含水的废弃
学位
蛋白质是基因表达的产物,是执行生命功能的基本载体,使得蛋白质组学成为后基因组时代生命科学中重要的研究领域。一般而言,相较于动物基因组,植物的基因组大、重复序列多且杂合度高,因此其蛋白结构功能多样性更为复杂。准确预测植物蛋白质,对植物蛋白质进行精准分类,是在分子层面深入理解植物生命活动物质基础的前提。随着植物基因组的发展,植物蛋白质数据大幅增长,通过传统的生物实验的方法确定植物蛋白质类别耗费时间且价
学位
随着新材料和微加工技术的不断发展和进步,微小型机电装置民用和军事等领域被广泛应用。在机电装置微小型化进程中,设计出能量密度高、续航持久且稳定高效的微型动力系统是当前研究的重点。鉴于碳氢燃料燃烧的优势,基于碳氢燃料燃烧的微型动力系统被提出,且有望解决微小型机电装置的供能问题。微尺度燃烧器作为微动力系统的核心,是其技术发展的关键所在。随着微燃烧器尺寸的减小,其面体比不可避免的增大,因此出现了热量损失显
学位
“绿水青山就是金山银山”,林业在环境保护方面具有重要研究价值和意义。随着计算机时代的到来,计算机视觉技术被广泛应用到各个行业中,若将计算机视觉应用在林业工程当中,对林业的发展具有重要突破意义。计算机视觉改变着传统林业的研究方法,林业信息工程技术日渐成熟。针对林业工程中对树木数量统计以及树高测量方法存在的结果准确性不高、操作困难、专业知识转化为规则困难等问题,利用计算机视觉理论、机制、方法以代替人工
学位
环境污染是全球面临的主要挑战之一。其中,由于工业生产活动产生的重金属、染料、抗生素和有机污染物是导致水、土壤和空气污染的主要源头。采取合适的污染物处理技术可以有效减小污染物对地球环境所构成的威胁。为此,一系列诸如电解、化学絮凝和催化降解,等技术被开发用于去除污水中的污染物。这些基于分解污染物的方法存在某些缺陷,诸如高成本、材料制备复杂、分散性差,等。以吸附法为基础的处理手段克服了这些缺点,因而被广
学位
抗氧化蛋白对于药物的开发和筛选具有十分重要的意义。抗氧化蛋白的鉴定已成为药物开发的关键工作之一,同时也是生物信息学领域研究的热点问题。传统的生物化学鉴定方法存在耗时长、费用昂贵等问题。随着蛋白质组学的发展、计算机硬件性能的提升以及机器学习算法的更新,使用数据挖掘和机器学习的方法鉴定抗氧化蛋白以替代传统的生物化学方法,成为了一种趋势。当前抗氧化蛋白的分类方法存在准确率低、速度慢的问题,为了提高抗氧化
学位
在汽车自动驾驶研究中,汽车对周围的环境感知是许多自动驾驶算法研究的基础,因此提高汽车环境感知的准确度和效率具有重要意义,能够为车辆自动驾驶的发展带来巨大价值。目前应用在车辆自动驾驶环境感知的硬件分为两种,一种是车载雷达,另一种是相机。近几年,随着深度学习技术在立体匹配中的突破,人们开始利用深度学习的理论方法来提高双目相机感知环境的精准度和效率。使用双目相机感知环境主要分为以下几个步骤:双目图像的获
学位
随着信息科技的高速发展与医疗行业的规范化,医疗病历数据电子化成为普遍趋势,电子病历共享有助于医疗行业正向发展。现有的医疗电子病历共享系统存在数据互操作性差、信息孤岛与存储安全难保证等问题,而区块链技术的引入能有效解决上述问题,但传统区块链存在性能限制,不能更好契合当前潜在用户群体庞大、操作频繁、数据存储量大以及数据流转多等医疗场景需求。针对基于传统区块链进行医疗数据共享时可扩展性受限制与加密数据可
学位
叶轮-隔舌动静干涉作用下,离心泵内呈现复杂的非稳态流动结构,并诱发高幅值压力脉动,水力激励导致泵产生振动噪声,是破坏系统、设备运行稳定及相关水下装备隐蔽性的主要原因。本文基于错列叶片与隔舌动静干涉相位差的控制,提出了一种新的错列叶片离心叶轮结构,以期降低泵内压力脉动能量。以一台低比转速离心泵为原型泵,通过数值计算与试验手段,开展了原始叶轮模型泵、不同错列叶片叶轮模型泵内部非稳态流动及其激励特性的研
学位