基于多目标特征选择的计算机辅助宫颈疾病诊断研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:milamiya2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机辅助疾病诊断技术是一种利用医学影像学、医学图像处理技术和生理生化技术进行疾病自动化诊断技术。虽然计算机辅助宫颈疾病诊断(ComputerAided DiagnosisofCervicalDiseases,CADCD)方法最近几年已经取得很大进步,但是随着大数据和人工智能时代到来,现有方法面临新的挑战包括大数据量、高维特征空间和多模态数据处理问题。CADCD方法的性能还不能满足人们的实际需求例如:诊断疾病种类有限以及无法有效利用多种模态数据。CADCD方法使用影像组学技术需要提取大量高维特征,但是随着数据维度增加,会产生大量无关和冗余信息降低学习算法性能并增加计算复杂度,引起“维度灾难”和“过拟合”问题。本研究立足临床实际需求,针对现有特征选择算法不能在不显著降低分类精度同时选择尽量小的特征子集问题,以及传统的评价准则不能准确度量特征间关联程度的问题,提出基于全局最优最大信息系数多目标特征选择算法,进而提出基于多目标特征选择的CADCD方法解决多疾病诊断问题和多模态数据处理问题。本文的主要研究成果和创新点如下:
  (1)对过滤式特征选择算法的评价准则进行阐述,并使用实验方式进行对比分析,探索评价准则的特点及存在问题。利用人工数据集定量论证最大信息系数能公平地度量线性、非线性函数依赖关系以及非函数依赖关系;在真实数据集上实验结果表明,基于最大信息系数特征选择算法显著优于基于互信息特征选择算法和基于皮尔森相关系数特征选择算法。
  (2)现有过滤式特征选择方法存在两个问题:使用的评价准则不能公平准确地度量特征间的关联性;以个体方式评价特征忽视特征间的内在联系。提出基于全局最优最大信息系数多目标特征选择方法,以整体方式的评价特征子集同时解决加权系数难确定的问题。根据最大信息系数提出最大依赖准则和最小冗余准则用于评价特征子集的有效性,以此建立最大相关度、最小冗余度、最小特征数为目标函数的多目标特征选择模型,采用多目标进化算法对多目标特征选择模型优化求解。提出方法能有效地在不显著降低分类精度同时选择尽量小的特征子集,具有较低计算复杂度和较高的适用性。
  (3)现有CADCD方法主要存在多疾病诊断、高维特征空间和多模态数据处理问题,多疾病诊断符合临床实际需求,高维特征空间增加计算复杂度和储存空间,从而影响诊断性能和不利于系统在贫困地区的推广,多模态数据的粒度和类型不同很难进行统一,针对上述问题,提出基于多目标特征选择的CADCD方法。提出多模态框架采用提取数值特征方式融合三种模态包括三种宫颈图像模态、细胞学检查报告模态和患者年龄模态,对于图像模态,提出基于k均值与代表性颜色的宫颈图像分割算法,从分割后三种不同类型的宫颈图像提取颜色特征和纹理特征,对于细胞学检查报告模态采用独热编码方式;融合多模态信息增加特征维数,提出基于全局最优最大信息系数多目标特征选择算法用于特征选择,能在淘汰冗余特征同时发现对疾病影响最大特征;使用随机森林利用选中特征实现对三种宫颈疾病进行诊断。该方法展现出计算复杂度低和综合诊断性能优秀的特点,并凸显多模态优势。
其他文献
我国是四环素类抗生素生产和消耗大国,四环素在养殖业中持续发挥着重要的作用。随着畜禽养殖规模的日益庞大,抗生素的滥用造成粪便中四环素残留超标,并诱导微生物抗生素耐药基因(Antibiotic resistance genes,ARGs)的产生。ARGs通过在各个环境介质中迁移、转化,对生态环境与人类健康构成巨大的威胁。堆肥技术在养殖粪便无害化处理上被普遍使用,黄孢原毛平革菌(Phanerochaet
甲壳动物表皮是抵御外界复杂环境的第一道屏障。为适应环境的变化、满足个体不断成长需求,甲壳动物在不同发育阶段,必须定期蜕去旧表皮并合成新表皮。而表皮中的主要成分就是几丁质。日本沼虾N-乙酰-β-D-氨基葡萄糖苷酶(Macrobrachium nipponense N-acetyl-β-D-glucosaminidase,MnNAGase)和日本沼虾几丁质酶3A(M.nipponense chitin
学位
水稻是全球主要的粮食作物,利用分子生物学技术鉴定水稻基因功能对揭示植株生长发育过程中的分子调控机制意义重大。本实验室前期从水稻幼穗c DNA文库中分离了一个Rho GTP酶激活蛋白编码基因,命名为OsRhoGAP2,并利用转基因技术构建了OsRhoGAP2过表达水稻,同时前期研究显示,OsRhoGAP2基因的启动子可响应非生物胁迫和激素信号,但具体的生物学功能尚不清楚。为鉴定OsRhoGAP2在水
学位
本研究以我国154个不同年代育成品种和138个农家品种为供试材料,采用田间种植,分析了籽粒微量元素锌、铁、铜、锰含量及生物有效性在不同年代品种、育成品种和农家品种间的差异,探讨了叶面喷施锌肥和铁肥分别对籽粒锌、铁含量及其生物有效性的影响,以期为生产上富含微量营养元素小麦品种的选育和栽培提供理论参考。主要研究结论如下:  1、供试品种籽粒锌(25.22~67.25mgkg-1)、铁(25.91~59
学位
藻类与水质是一个相互依存的有机整体,二者的相互作用不仅可以影响水质,还对维持健康的生态系统同样重要,通过研究藻类和水质的相互关系,可以帮助我们快速了解某一个水体生态的健康程度,同时对水质的保护也具有参考意义。本研究选取了淡水常见的硅藻作为研究对象,通过对硅藻与水体营养关系的研究,了解二者相互作用及依存条件,也为揭示自然条件下硅藻的生长和消亡对水质的变化提供科学依据。本研究以硝酸钾为氮源,以磷酸氢二
学位
长期以来,繁殖作为进化的核心问题,一直受到生物学家的广泛关注。青藏高原作为世界上海拔最高、面积最大的高原,具有低温、低压、强风、多雨、积雪、强紫外辐射等特点,但该地区植物的生长和繁殖都表现出对恶劣环境极强的适应性,不仅能够适应各种非传粉生物的选择作用,在严酷的高山环境下也能表现出较高的繁殖成功率。青藏高原特殊的地理位置和气候条件,孕育了丰富的植物多样性资源,为研究高山植物生态适应和繁殖机制提供了理
学位
随着水产养殖业的快速发展,其出现的问题也越来越多,其中以嗜水气单胞菌为主的气单胞菌属所引起的鱼类中感染力强、发病率高的细菌性败血症受到了的大家的广泛关注。同时,以氟虫腈为主的苯基吡唑类杀虫剂,被人们广泛用于农作物和家庭卫生等的害虫防治,导致其残留物在水体、土壤、蔬菜表面等处经常被检测到,而水环境中的药物可能会对水生动物造成一定的毒害。本文以鲤鱼为动物模型,探究了嗜水气单胞菌及其联合氟虫腈对鲤鱼的氧
学位
随着电力系统装机容量的不断扩大和对运行可靠性要求的进一步提高,发电机保护断路器作为发电机主回路中的重要的控制保护设备,简化了电站设计及操作,提高了电站运行的可靠性,其产品研发及关键技术研究至关重要。本文以18kVSF6发电机保护断路器为研究对象,以电磁学、机械动力学、流体力学、数值求解技术以及计算机技术为支撑,根据能量守恒定律和贝努利方程及气流特性建立了配氮气储能液压机构的压气式SF6发电机保护断
目标定位技术在现代生活中起着越来越重要的作用。在军事领域,空中目标侦查,制导,追踪和打击离不开精确的目标定位技术。民用方面,陆地车辆导航,城市搜救系统,商场导购等也很大程度依赖于精确的目标定位技术。但是,目标所处的环境通常复杂多变,天线的接收信号中包含多条多径反射信号。因此,如何在复杂多径环境中实现目标的高精度定位是目前学术界和工业界普遍关注的问题。  过去的研究多集中于尽量避免多径以及利用各种措
学位
雷达在对海探测时会不可避免地接收到来自海面和各类目标的散射信号,海上目标种类繁多且海面回波特性复杂多变,因此在复杂海杂波背景下有效检测海面目标信号一直是雷达领域研究的热点。低分辨率或者大擦地角的海杂波往往使用高斯模型描述,然而随着分辨率的提高或者擦地角的减小,海杂波不再服从高斯模型,而是表现出强烈的非高斯特性。传统针对高斯模型的自适应相干检测器在非高斯海杂波背景下会出现高的虚警概率或者低的检测概率