基于邻域互信息的优化特征基因选择研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:oldehero
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二十世纪末,在分子生物学领域,出现了DNA微阵列技术,它属于一项高通量的测序技术,即可以在同时测试细胞中成千上万个基因活性,仅仅是一次实验,这使得以前对单个基因的研究,现在进入到了基因组学的研究。通过对基因表达谱进行数据挖掘,对研制新药、了解疾病发展机理以及诊断等具有重要意义。基因表达谱数据具有高维、小样本、高噪声、高冗余以及连续型等特点,这对传统数据挖掘方法的应用提出了更高的要求。本文在梳理、分析和总结现有数据挖据方法的基础上,针对目前基因表达谱数据挖掘方法中所存在的问题展开,主要从特征基因选择方面进行针对性研究。研究内容和主要成果如下:本文将邻域互信息理论应用到特征基因选择方法,并将基于优化特征的邻域互信息作为相关度的度量标准,提出了一种特征基因选择算法。首先对所有基因进行排序,采用Relief F算法,并取其前k个基因作为初次选择的基因子集,并剔除了噪声基因,以期降低数据维数,同时提高数据质量;然后,对于对邻域互信息模型的性能,考虑到邻域半径的影响,本文采用差分进化的算法实现它的优化;最后,采用前向贪婪搜索策略改进了邻域互信息模型,并且实现了基因的最终选择,而剔除了更多的噪声和冗余基因,使之获得了具有更高识别性能和明确的生物意义的特征基因。仿真实验结果表明,本章提出的方法获得的特征基因的识别精度和特征基因数量等方面明显优于Relief F、Kruskalwallis、Gini Index、MI和NMI等方法。
其他文献
丢番图方程是指未知数个数多于方程个数的多项式方程(或方程组),是数论中最古老的一个分支.与丢番图方程有关的问题称为丢番图问题.“万物皆数,数是万物之本”,几何上的对称和优美赋予了形数极大的魅力.从数到形,在几何中,把由有限条线段连接成的封闭图形叫多边形.本文主要讨论了关于形数与多边形的丢番图问题.首先,我们研究了与三角形数相关的丢番图方程,讨论了两个三角形数的线性组合表为平方数.利用Pell方程的
随着海洋油气开发走向深海,生活支持平台(Accommodation support platform)或称为住宿平台(Floatel)等浮式结构物,在生产平台、海洋结构物的作业现场安装、试运行及维护等项
潮汐瓦解事件(TDE)是黑洞研究中的一类高能暂现吸积现象,也是研究宁静星系中心超大质量黑洞的一种独特手段。它对于黑洞吸积的整个动态物理过程、相对论喷流以及星系核心气体
水凝胶是一种3D网络结构中包含大量水的软质材料。由于它的仿生性质和出色的生物相容性,已广泛用于生物,化工,农业及其他领域。然而,这些水凝胶在使用过程中可能会出现结构退
光催化作为一种可以直接将太阳能转换成化学能的有效方式,已被广泛研究。由于SnS2具有较窄的带隙能量(1.91-2.35 eV)和比CdS更好的性能(如低毒性、良好的化学稳定性和热稳定
笔者在绘画创作的过程中常常陷入思考,为什么在一个有限的二维平面中既可以展现出无比辽阔的平原也可以描绘出错综复杂的市井,正是基于对此问题的思考,笔者通过研究视觉绘画的艺术规律以及内在绘画的表现技法,来展开对于塑造空间感的探究,从而完成自己的绘画创作。本论文对绘画中空间感的塑造以及空间感带给观者的视觉感受进行了较为深刻的研究和分析,掌握了一定的视觉绘画规律,为此次创作奠定了扎实的理论基础。本次论文由五
对于单调关联系统,工程师和系统设计者感兴趣的一个问题是:当系统在某时刻处于存活(失效)状态时,系统中每个元件所处的状态是怎样的?在该时刻这些元件中有多少已经失效?基于
本文首先研究了 Rees短正合列的一些基本性质.其次探讨在Rees短正合列0→XS→YS→ZS→0中,平坦性质(自由的,弱投射,R-挠自由,(强)忠实,条件(E),(E’),(P’),(PA),C(P’)系,P-
2018年,魏加群教授在三角范畴T中给出了ω-Gorenstein对象的概念,这里ω表示T的一个presilting子范畴,并证明了Gω是关于扩张,直和项,以及有限直和封闭的.本文将在魏加群教授
二氢嘧啶是一类含有两个氮原子的杂环化合物,其衍生物具有广泛的药理和生物活性,如抗癌、抗炎、抗高血压、抗菌和除草等活性。螺噻吩是一类含硫原子的螺杂环化合物,其衍生物