大肠早癌辅助诊断数据挖掘方法研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:xzcfjeom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗诊断技术的发展,各个医疗部门积累了大量医疗诊断信息,如病人的医学影像资料、生理生化指标、生物信息学指标、病人背景资料等,这些数据资料背后隐藏着很多有可能成为临床辅助诊断依据的重要信息,因此有必要利用相关技术对这些重要信息进行分析处理。数据挖掘是广泛应用于医疗诊断数据分析处理的技术之一,采用数据挖掘技术可以通过对患者资料数据库中大量历史数据的处理,挖掘出有价值的诊断规则,从而依据患者的年龄、性别、生活习性、辅助检查结果、生化指标等做出判断,排除人为因素的干扰,客观性强,得到的诊断规则有着较好的普遍性。本文以数据挖掘技术为基础,以激光诱导自体荧光大肠早癌诊断数据为载体,通过分析诊断数据特征,从数据预处理、训练数据集的形成以及分类预测方法三个方面,对大肠早癌诊断数据进行深入分析研究,形成激光诱导大肠早癌辅助诊断系统,为临床医生提供辅助诊断的手段。本文首先分析了激光诱导自体荧光诊断大肠早癌的机理、特点、研究意义,根据医疗诊断数据特征,提出了激光诱导自体荧光大肠早癌辅助诊断数据分析处理流程,并对各部分进行了分析,着重阐述光谱数据采集系统组成以及光谱数据的采集方法,同时进行了滤除高频电子噪音,剔除光谱基线、截取有效带宽信号以及归一化荧光光谱的数据除噪处理。面向不完整的大肠早癌荧光数据,通过分析比较特征提取方法,本文提出基于容错关系的信息熵粗糙集主成分分析算法,容错关系粗糙集较之传统粗糙集能满足诊断数据的不完备性,同时引入随信息量减小而单调下降的信息熵,在此基础上提出属性约简方法,对光谱数据进行属性约减,并利用主成分分析算法进行进一步的特征属性提取。通过该算法,提取了影响大肠早癌诊断的特征数据,降低数据维度,减少后续数据处理的复杂度。由于医疗诊断数据中多为混合数据的特性,通过分析现有混合数据聚类算法,本文提出了基于格论的混合数据聚类算法。利用格进行数据分布以消除数值型属性和符号属性的分布差别,利用数据间格的涵盖数目来进行聚类计算,因此该算法在进行混合数据处理时不再需要进行数据转换。针对算法中的参数,即初始聚类数目和中心点的选取进行了优化分析,其中初始聚类数目利用遗传算法进行优化,获得初始聚类数目的取值空间;同时对中心点的选取进行了优化说明,同时对算法性能进行了分析。以形成的聚类数据集为基础,利用均值方差法和荧光强度比值判别法进行数据特征的提取,得到正常组织和癌症组织的分类特征,为分类判别提供依据。针对医疗诊断数据中实时性要求,通过分析所采用的分类算法性能,发现该分类算法存在着大量重复计算,因此算法复杂度和算法的空间复杂度比较高。为解决这一问题,本文提出了基于检索树结构的处理方法,通过构建检索树,将多数重复计算节点构建在检索树的高层,无重复节点建立在检索树的下层,以此来降低算法的重复计算,有效地降低了算法复杂度以及空间复杂度,以满足诊断实时性要求。针对医疗诊断数据中的不平衡性,在分析了非平衡数据分布特征以及当前的非平衡数据处理方法后,利用样本处理技术,本文提出了全局密度非平衡数据分类,μ-密度非平衡数据分类方法以及边界样本局部密度的非平衡数据分类方法,全局密度非平衡数据分类方法以各自类别的样本为基础进行综合平均,这种方法有利于稀疏数据的分类而降低密集数据分类有效性;μ-密度非平衡数据分类方法通过代价敏感方法,分析样本分类正确性代价,得到合适的μ值进行样本数据的选取,以提高非平衡数据分类有效性;边界样本局部密度的非平衡数据分类方法着重分析处于非平衡数据集中的边界样本数据,通过多种方法进行边界数据的分类,同时对算法中的相关参数进行分析。这三种算法都是通过样本数据选择,提高少数类样本数据量以减少数据非平衡性。论文最后总结了全文的创新点,提出了今后将继续进行的研究方向。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
互联网+产生了许多新事物。当互联网+教育这个名词呈现在大众视野的时候,政府、机构、学校和老师纷纷关注并开展了许多研究。《大学生心理健康教育》课程是一门在校大学生必须学
近年来,我国旅游产业发展迅速,高职旅.掰教育蓬勃发展,但也出现了毕业生与市场需求不匹配甚至错位等问题。本文从提高学生素质和加强实践教学两方面对高职导游人才培养模式进行初
Beat Generation,美国五十年代的颓废落拓的文学流派,国内译为“垮了的一代”.五十年代也正是我在纽约文艺青年群中混迹的时期,我也反对世俗陈规,虽然并没有一窝风地模仿他
本文从"形""神"角度,阐述了形神失调是脑卒中后失语的病因基础、基本病机、诊断要点,从而提出"形神共调"的基本治疗原则,将"形神一体"理念贯穿于脑卒中失语诊疗的各个环节。分析当前
王阳明本人与黄绾、应良、金克厚、潘城等台州籍的阳明弟子,以及王畿、钱德洪、薛侃、郑善夫、应典、陈明水等阳明学者,均与以“佛宗道源”著称的天台山关系密切。故而作为浙江
抗震设计不再是原来的保证承载能力的结构设计思路,而是要赋予结构以必要的非弹性变形的能力,使结构能够经历足够大的地震的冲击。中国抗震设计规范采用多遇地震作为建筑结构截
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目前,在城建管理工程施工的管理当中,由于一些问题和不足影响着城建工程的质量,为此,需要采用有效措施来保证城建管理工作顺利进行。本文对如何开展管理进行了研究,帮助管理
随着各领域对数字视频需求的日益增加,视频的网络传输越来越受到人们的重视,面向视频对象的编码和处理技术成为研究的亮点和热点。例如以MPEG-4为代表的第二代压缩编码技术,