特征选择算法研究及其在孤立肺结节诊断中的应用

来源 :重庆大学 | 被引量 : 0次 | 上传用户:z174433854
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘、机器学习、统计模式识别等相关领域中,特征选择作为数据预处理的一种重要而常用的方式,是监督学习算法的一个重要组成步骤。随着计算机科学和技术的发展,图像处理、生物信息学等大规模问题不断涌现,对已有的特征选择算法提出了严峻的挑战,迫切需要适应大规模数据的准确性和运行效率等综合性能较好的特征选择算法。本文在大规模数据的特征选择以及特征选择在孤立肺结节计算机辅助诊断中的应用开展了一些研究工作,主要做了以下几部分的工作。首先,对目前特征选择的研究现状和问题进行了具体而深入的研究,分析了特征选择的定义、过程、分类以及常规的特征选择算法模型,提出了特征选择算法的选用技巧。其次,提出了一种新的基于粗集(RS)与遗传算法(GA)的特征选择算法。该方法将遗传算法(GA)与粗集(RS)思想有机结合进行特征选择,引入粗集中相关属性依赖度,设计了适应度函数和遗传算子,以提高算法的时间效率,并获得良好的搜索结果。同时,将该特征选择方法应用于图像特征分析,实验表明该方法达到了满意的效果,具有较高的效率。另外,基于Filter和Wrapper各自的优缺点,提出了一种基于蚁群算法的组合式特征选择算法。该算法将蚁群算法用于特征选择,将特征作为位置点,采用支持向量机分类器评价特征子集的性能,对特征(点)进行信息素的计算和更新,为特征与特征子集的选择提供了依据,避免了盲目搜索,使搜索算法能够快速收敛。在8组实际数据集中的实验结果表明,从分类正确率、特征子集大小以及运行时间等多个角度考察,该算法具有良好的综合性能。然后,把特征选择算法应用于孤立肺结节的计算机辅助CT诊断。系统地介绍了孤立肺结节计算机辅助诊断系统,描述了系统知识库的建立,研究了特征对于孤立肺结节诊断的重要性并提出了特征的层次化结构,同时将本文提出的两个特征选择算法在人工数据集上做了实验,选择的特征较真实地反映了医学诊断依据并获得不错的分类效果。本文最后对研究工作进行了总结,提出了今后进一步的研究方向。
其他文献
随着现代农业技术的广泛应用和农产品市场体系的建立,齐齐哈尔市农业生产结构性问题开始出现,农民卖粮难问题日益突出,农业发展中的主要问题已经从生产领域转移到流通领域,农
本文运用2011-2016年发布股权激励计划的我国A股上市公司数据,从激励效率的角度,探讨公司规模、成长性及产权性质等异质性要素如何影响公司股权激励工具的选择。研究发现,公
发动机的机械结构由箱体、箱盖、曲轴、连杆等部分组成,其中曲轴属于较为关键的零件,也是对发动机的质量与性能产生直接影响的零件。由于曲轴具有较复杂的结构、较多的加工表
数据拟合是根据数据发现变量之间的关系表达式,常常用于对生产生活和科学实验中的观测数据进行分析和预测。数据拟合的方法可以分为两类,传统拟合和智能拟合。传统拟合的方法
创新一直是社会经济持续健康发展的不竭动力,但是以往的观点常常只认为研发是唯一的创新途径,而对于实力薄弱的中小企业来说,想要走研发之路是"有心无力"。事实上,中小企业开
通过介绍成洛大道综合管廊工程大直径土压平衡盾构机分体始发技术,对盾构机的分体始发总体筹划、部件改造、专用钢构受力分析、临时台车及延长管线规划等技术方面进行了详细
本文探讨并实践了"毛泽东思想和中国特色社会主义理论体系概论"课以教室、校园、社会为场所,开设理论教学、校园实践教学、社会实践教学"三课一体"的教学模式。此模式改变了以教
现实生活中,许多复杂的工程问题存在非线性、大规模、多模态、动态性的特点。传统的进化算法求解这类问题存在一定的局限性,因此需要对传统进化算法进行改进从而达到解决这类
选取二维单扰流柱为研究对象,通过CFD软件和拉格朗日方法,引入2d-LES模型模拟湍流场,采用离散相模型(DPM)计算颗粒的运动轨迹;利用欧拉方法,采用颗粒群平衡模型(PBM),通过用
以牛血清蛋白、胰岛素、谷胱甘肽为水溶性药物模型,采用玻璃微球法制备其脂质体,以包封率为评价指标,研究玻璃微球法制备水溶性药物脂质体的具体工艺。结果表明,在最优工艺下