基于邻域互信息的肿瘤基因选择研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:roytseng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互信息是属性间相关度的度量,适用于特征选择问题,同时它与具体分类器相独立,能与多种分类器结合产生很好的分类效果。然而,互信息只适用于离散型数据,不能直接处理基因表达谱数据。针对基因表达谱高维度、低样本、不完备和连续型的特点,结合基因初选方法,将邻域互信息作为相关度度量,提出一些特征选择算法应用于肿瘤基因选择,并以理论及实验分析说明了这些算法的有效性。本文主要内容如下:针对基于信息熵的基因选择分类精度较低与计算过于复杂的问题,提出基于邻域条件互信息的肿瘤分类基因选择算法。首先,将邻域概念引入信息熵理论,定义了邻域条件互信息,计算连续型属性对于肿瘤分类的重要性。其次,针对样本邻域的计算过于复杂的问题,通过近似度量公式进行简化处理,降低了算法的时间复杂度。然后,结合顺序前向搜索策略构建了一种快速肿瘤分类基因选择算法。针对基因表达谱高维度、低样本的特点,提出基于邻域互信息的肿瘤基因聚类算法,将属性聚类成簇,从而发现了有意义的模式。首先分析了以往聚类方法在处理连续型属性时的不足,从而引入邻域互信息计算连续型属性的相关度。其次,提出一个属性聚类算法将属性聚类成簇。然后,将此方法应用于基因表达数据,发现了有意义的簇,从而得到了包含基因分类和识别能力的基因。针对现有两种特征选择方法的各自优点及存在的不足,将特征选择的过程分为两个阶段:第一阶段采用过滤法,提出用邻域互信息计算每个属性与分类的相关度;第二阶段采用缠绕法,提出用粒子群优化算法检测已经标识的相关属性子集,选择出最优或者次优属性子集。最后,通过支持向量机与留一法交叉验证所选特征子集的有效性。
其他文献
目的:检测异黏蛋白(metadherin,MTDH)在子宫内膜癌组织和正常子宫内膜组织中的表达,分析两组间的表达差异,探讨MTDH的表达水平与子宫内膜癌患者临床病理特征的关系,为子宫内膜癌诊断
针对电网投资建设项目经济性后评价问题的复杂性和模糊性,在参考以往电网投资建设项目经济性评价理论研究的基础之上,建立电网建设项目经济性后评价层次分析结构模型和模糊层
我国外观设计专利初步审查过程中不做检索,只进行形式审查,即做出是否授权的决定。《专利法》第二十三条的实质审查主要发生在狭义的确权阶段。第三次修正后的专利法律、法规
独立学院兴起于20世纪末,距今为止已经具有将近二十载的发展历史,根据教育部2018年统计,全国共有独立学院265所,在校学生人数占普通高校本科在校总人数的百分之二十以上。作为我国高等教育持续发展过程中的重要成员,独立学院的办学定位为教学型学院,主要进行应用型本科阶段教育,以培养出满足市场和经济社会发展需求的应用型人才为目标。人才的培养质量是由教学质量决定的,高质量的教育离不开高水平教师的支持。对于
目的:探讨伊伐布雷定在增龄性房颤中的作用。方法:选择12只老龄健康比格犬,雌雄不限。随机分为窦律组、房颤组和伊伐布雷定药物干预组,每组各4只。房颤组通过快速心耳起搏造房颤模型犬。伊伐布雷定组在房颤模型成功后给予药物干预2周。各组给予心脏超声检测(测量心脏各腔大小等指标),电生理检测(心房有效不应期,窦房结恢复时间,心房颤动诱发率,房颤持续时间)。结果:与窦律组比较,房颤组左心房内径明显扩大(28.
随着素质教育的发展,人们对学生学习的评价不再满足于只报告测验分数,而是希望能够更加详细地了解学生的知识结构。认知诊断理论从认知心理学角度分析学生解决问题时所用的知识和技能,并融入测量学模型。通过诊断评估,获得学生知识结构优势和不足的信息,为教师的教学和学生的自主学习提供指导。本研究严格按照认知诊断测验编制的基本流程和原则,以人民教育版本的八年级数学(上册)内容为例,基于G-DINA模型下开发系列侧
目的:探讨晚期胃癌患者血浆外泌体miR-17-5p、miR-200c的表达及化疗前后、疾病进展血浆外泌体miR-17-5p、miR-200c表达量的变化,并明确这种表达能否成为晚期胃癌化疗及疾病进展的预测因子,为青海地区胃癌患者制定个体化的治疗策略提供重要的实验依据。方法:选取2016年11月2018年12月青海大学附属医院经病理确诊的晚期胃癌患者40例作为实验组,健康人20例作为对照组。实验组给
目的:建立BALB/c小鼠结肠癌肝转移模型,在大肠癌肝转移模型中,探讨磁场强度、热疗时间、磁流体浓度对肿瘤局部温度的影响并研究局部注射磁流体对微小血管的影响,为今后结肠癌
恶性肿瘤是严重威胁人类健康生活的一种疾病,而以手术为主要医疗方式的治疗方法对于广泛转移及复发的晚期恶性肿瘤来讲效益不大,因此肿瘤的靶向治疗成为了人们关注的重点。有
来自于十字花科蔬菜的异硫氰酸酯类化合物(isothiocyanates,ITCs),是一类重要的癌预防试剂,受到人们的广泛关注。其中,莱菔硫烷(sulforaphane,SFN)、苄基异硫氰酸酯(benzyl i