基于JEP的癌症分类算法研究

被引量 : 0次 | 上传用户:wyxxzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是数据挖掘和机器学习领域的一个重要问题,目的是通过训练数据集构建一个分类器来预测新的实例类别。近年来,DNA微阵列的发展为很多领域提供了一种高维数据,主要应用于癌症诊断和预测。跳跃显露模式(Jumping Emerging Pattern, JEP)是一种区分能力强的特殊模式,在分类方面有很明显的优越性。随着DNA微阵列和基因模式的快速发展,本文提出一种基于JEP的癌症分类算法。为了进一步提高癌症分类准确率,本文还研究了基于JEP癌症分类的组合分类算法,这在生物学、医学领域具有重要的研究价值和实际意义。本论文主要从基因表达数据的分析着手,其主要工作归纳如下:一、对基因表达数据进行预处理,DNA微阵列产生的数据具有高维性,有很多噪声,本文采用基于信息熵的离散化方法将连续属性离散化,依据最小长度原则找出基因的分割点,计算熵值,筛选出分类特征基因。熵值越小,特征基因分类能力越强。这种离散化方法可以有效消除噪声数据的影响。二、提出一种更具鉴别能力的基因模式,称为增强跳跃显露模式(IJEP),这种模式满足增长率趋近无穷大,且任何子集都不是IJEP的条件。提取IJEP的特征基因是通过基于信息熵的离散化方法获得,并在计算信息熵时,通过引入贝叶斯m-估计以克服小容量样本下频率等于概率的缺陷,从而提高熵的可靠度。三、用边界算法挖掘出有效的IJEP。用BORDER-DIFF算法获得不同的边界对,再用MBD-LLBORDDER算法产生IJEP。有效的缩短了IJEPs的挖掘时间。针对挖掘出的IJEP,提出一种癌症分类算法(CIJEP),同时通过改进相似度量的计算来提高预测的可信度。四、以基于IJEP的癌症分类器作为基分类器,将集成机器学习应用到癌症分类中,提出了Bag-CIJEP、Boost-CIJEP两种算法,在四个数据集上进行实验,实验结果提高了癌症的分类准确率。
其他文献
文章通过分析2011年江苏省颁布的《江苏省知识产权创造与运用专项资金使用管理办法》一系列4个文件,梳理了知识产权创造与运用专项资金使用管理方面的政策演变,分析了政策变
<正>目的通过加强对糖尿病患者的健康教育与管理,改善对糖尿病的认知水平,提高治疗依从性,提高知晓率、治疗率和控制率。方法对住院及门诊就诊糖尿病患者及家属、30个社区糖
会议
目的了解某院老年住院患者使用肾康注射液超说明书用药情况。方法抽取2015年1月至2017年7月年龄在60岁(含60岁)以上使用肾康注射液的住院患者信息,回顾性分析老年患者超说明
通过对美孝村走访探查,从村落布局、院落格局、历史背景、宗教文化等方面进行研究,推演并还原出美孝村原初村落的可能形态,在此基础上研究其防御系统,发现美孝村古村落在空间
语言承载着文化,对于英语的学习就是一个了解和掌握欧美国家相关背景知识的过程。教师在英语教学的过程中,不仅仅要帮助学生掌握最基本的语言知识和技能,还要帮助学生熟悉和
采用智能弦式数码压力系统对方墩模板在混凝土浇筑的过程中进行了现场原位试验研究,揭示了模板最大侧压力的形成特点和规律;通过对现场实测数据与理论计算最大侧压力的分析,
抓取和放置机构是半导体设备上的关键机构,它的运动时序直接关系到设备运行效率,介绍了半导体设备抓取和放置机构的几种控制方法,通过对几种方法的运行轨迹进行对比,获得并列
高功率脉冲磁控溅射(HPPMS)因其高离化率而得到广泛关注。高压大电流脉冲电源是实现该技术的重要环节之一。本论文介绍了一种HPPMS电源,该电源由充电电源、斩波输出两部分组
从AVO技术最初用于识别"亮点"等振幅异常开始,特别是近几年来新科技的发展和应用,使该技术在油气勘探领域中具有不可替代的作用.用AVO拟合的纵横波、梯度、近道和远道迭加等
本文从项目教学法实施现状出发,分析了当前在高职教学中实施项目教学法面临的主要问题,并分析其产生的根源,最后就这些问题提出了相应的改进措施,以期对今后的教学改革起到抛砖引