面向癫痫发作分类的特征选择与集成方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:zj2008263
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癫痫是一种具有反复发作特征的常见神经系统疾病。在癫痫发作时,常伴随着严重的个体伤害风险,严重妨碍患者独立生活的能力。脑电图(EEG)广泛应用于癫痫的检测与诊断,传统的脑电诊断依赖于对异常EEG信号的人工识别。计算机辅助诊断系统可以大大减轻在脑电异常数据筛查过程中对经验知识要求高、误诊率高以及较为耗费人力等问题。人工智能辅助诊断癫痫病症的研究通常集中在三个方向:1)脑电数据的数据预处理方法;2)脑电特征的处理,如特征选择和特征变换等方法;3)数据结果的处理,如预测和分类的方法。
  目前大部分的研究工作都集中在脑电数据的预处理方法及分类算法的研究上,对于脑电特征的处理存在着较大的研究空间。此外,在使用多分类器的过程中,研究人员通常只考虑到了分类结果的阶段性生成和融合,而忽略了对子分类器的结果进行选择性融合。为了获得更优的特征子空间组合,本文提出了两种用于癫痫诊断的框架,其创新点如下:
  1)提出了一种新的自适应混合特征选择方法(AHFSE)。AHFSE的主要思想是利用自适应的秩组合以寻求更优的特征组合。通过对数据进行多角度的分析和探索,从而提高检测和分类的性能。在秩组合阶段,AHFSE采用了进化选择的思想,自适应地选择出每一步中更优的特征组合。采用了小波变换方法的AHFSE算法在性能上得到了显著的提升,不仅优于其他单一的特征选择算法和其他单一的小波变换方法,也优于其他的集成方法。AHFSE的局限性是需要较长的模型学习时间,因为它使用了遗传算法进行优化,但它是可以被其他较快的算法所替换的,例如使用可以自由选择组合和变异的粒子群算法。虽然我们的算法在模型学习中需要较长的时间,但是当模型学习完成后,对于癫痫发作的实时检测和分类是准确且快速的。
  2)提出了多目标集成叠加混合框架(MOSHE)。MOSHE的主要思想是在集成过程中能够最大化地利用分类器的多样性,自适应地选择出更优的分类器组合。为了提升预测和分类的性能,MOSHE会将特征从原样本空间转换到特征差异更明显的新样本空间。根据准确率和多样性,采用非支配排序遗传算法得到更优的分类器组合。与同类算法相比,采用了离散小波变换和TunableQ小波变换的MOSHE,在分类性能上得到了显著的提升。另外,利用并行处理方法可以有效解决MOSHE在学习过程中需要较长时间的局限性,同时,NSGA-II也能够被其他具有自动平衡交叉和变异概率特点的多目标方法所替换。
其他文献
近年来,数据量的激增迫切需要对可扩展机器学习关键技术的研究,而当前丰富的计算资源又为可扩展机器学习提供了机遇。为实现可扩展机器学习,本文从高效算法设计和并行与分布方法两条技术途径入手,对机器学习如何有效应对大数据挑战展开深入研究。基于算法与系统的协同设计,在保证精度的前提下,有效提高了机器学习的速度,增强了机器学习在计算和内存方面的扩展性,取得了以下几个方面的研究成果:  1.提出了两种数据和模型
学位
大规模分布式系统已成为云计算和现代应用的主要支柱,数十亿的终端用户实时依赖于这些系统的可信性。不幸的是,分布式系统中的性能缺陷常常引发严重的性能损失,继而导致糟糕的用户体验并带来严重的经济损失。然而,由于分布式系统中性能缺陷的复杂性和多样性,检测分布式系统的性能缺陷面临着大量挑战,特别是缺乏对分布式性能缺陷的全面且深入的认识、难以检测高复杂性的分布式性能缺陷,以及对涉及到复杂多线程的分布式性能缺陷
学位
大数据时代,数据量正以前所未有的速度增长,全球数据总量突破10ZB,单个数据中心数据量也达到了EB级。数据量快速增长对存储系统提出了更高的挑战,其中,如何有效地对大数据进行保护成为研究热点。作为数据保护最常用的手段,备份系统会成倍地增加数据量,带来严重的存储空间消耗。研究表明,数字世界中包含大量冗余数据,尤其是在备份系统中,冗余数据比例普遍高于80%。重复数据删除作为一种数据缩减技术,能有效地检测
学位
图像是人类获取信息的重要来源。随着带有高清摄像头的智能手机的普及和成像器件在城市安防、卫星遥感遥测等诸多领域的广泛使用,这些成像器件产生着数量巨大的图像数据。人们对收集到的上述图像数据进行分析与处理,获得关于真实世界重要信息。然而,数字图像在成像、传输、存储等各个环节都不可避免的受到各种降质影响而降低质量,如噪声、低分辨率、模糊等。图像的质量对于基于图像的分析与理解的准确性有着极大的影响。因此,图
学位
生物信息学是在20世纪80年代开始,由生命科学与数学、计算机科学等学科交叉形成的一门新兴学科。对RNA的研究始终是生物信息学中一个十分重要的研究方向,且其热门程度呈不断上升的趋势。越来越多的研究表明RNA不仅能作为遗传信息的载体,也具有各种重要功能。已经证实,RNA的功能与其结构有着紧密的关联。为了更好地探索RNA的功能,就要对其结构进行研究。由于RNA分子具有降解速度快、难以结晶的特点,采用常规
随着大数据处理技术及人工智能的发展,机器人的感知和处理能力不断提高。机器人被广泛应用于工业、农业和日常生活等各个领域。与单体机器人系统相比,机器人群体通过协同合作可以获得更好的性能。自主控制是实现机器人群体应用的关键,保持通信连通是机器人群体协同合作的基础。然而,大多数现有的自主控制方法以群体连通作为前提假设,适用性不足。因此,研究机器人群体连通性与自主控制问题具有重要意义。本文在分析机器人群体连
关键基础设施网络是现代社会繁荣与发展的基石,其安全运行对于社会的稳定、国家的安全具有重要意义。然而,关键基础设施网络的安全稳定运行面临诸多挑战:自然灾害频发,人为失误和恶意操作不可避免,通过网络损毁物理实体成为可能,以上诸多因素使得关键基础设施网络中部分组件的失效不可避免。同时,网络的融合带来了级联失效的风险,单个组件的失效可能导致整个网络的崩溃。鲁棒性,一般定义为失效或恶意攻击下的生存能力,是衡
近年来,Android设备的用户数量不断增长,已经成功攻击者的攻击热点。TrustGo公司的分析应用报告显示,Google Play上3.15%的应用有可能泄露用户隐私或者存在恶意行为。而我国用户无法直接从Google Play上下载应用,导致了大量的、管理混乱的第三方应用市场的存在,对于Android设备安全性造成了严重的威胁。合谋作为一种隐蔽的攻击方式并不被大众重视,而由于Android简便的
学位
随着计算机技术的发展以及各种成像设备的普及,当前的互联网上累计了海量的地标和街景图像数据。给定查询图像,如何高效而精确地从这些大规模的图像集合中检索出内容相似的图像,成为了许多应用中的迫切需求。论文针对地标图像检索以及街景图像位置识别,围绕基于词包模型的地标图像检索方法中的爆发性问题、基于深度学习的地标图像检索和街景图像位置识别方法以及基于矩阵分解的相似度搜索方法开展研究。主要的研究工作如下:  
对于一个对象,可以从各种渠道获取到形式丰富的多方面信息,形成多视图数据。多个视图之间通常具有一致性和互补性,如何从这样的多视图数据中学习是一个非常重要的课题。同时,在实际应用中,收集到的多视图数据往往由于现实环境的种种因素,带有噪声甚至产生缺失,从而不能形成理想中完整且无噪声的高质量数据。如何从这些低质量的多视图数据中有效地学习知识,是多视图学习技术能否更广泛地应用于现实世界的关键。本文聚焦于多视