基于相关性分析的基因选择算法

来源 :浙江大学学报(工学版) | 被引量 : 0次 | 上传用户:ch101732
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
常用的排列法从微阵列数据中选择的基因集合会包含相关性较高的基因,这会影响分类器的性能,为了去除这些冗余基因(特征),提出了无监督的特征选择算法.该算法主要包含:将原始特征集划分为一组相似的子集(聚类);从每个聚类中选择代表性特征.特征的划分采用特征间的相关性作为测度以k近邻原则来完成.该算法无需指定聚类数量,时间复杂度低.真实的生物学数据实验证明该算法可显著提高分类器的分类准确性.
其他文献
对工业反应条件下的对二甲苯氧化过程进行了实验研究,测定了不同氧气体积分率下的液相、气相各组分浓度随时间变化关系.采用双曲型的主、副动力学模型拟合实验数据,得到了各
通常使用Web包装器将HTML数据转化为XML格式的结构化数据.包装器描述语言(WDL)提供一套完善的语法,通过使用XML来描述Web包装器的各个方面,从而实现了包装器的快速生成.它提
在研究实时数据库理论的基础上,分析了当前主流工业实时数据库功能及外部应用环境和条件的变化,结合最新的信息技术,设计了一种新的面向需求的实时数据库数据管理模型,提出了
介绍了管道集肤效应电伴热系统的一种新型设计方法,推导了管道温度控制系统的数学模型,介绍了系统硬件和软件设计.通过伴热电源控制器输出脉宽调制(PWM)信号,控制绝缘栅双极
对气力输送系统中具有不同初始状态的固粒群在加速区的气固两相流动进行了数值模拟.气流场采用修正的k-ε湍流模型进行计算,利用相间滑移数值方法(IPSA)求解全流场的Navier-S
针对目前广泛存在的微分代数混杂系统(DAHS)的一般模型,提出了包括稳定性和(大范围)渐近稳定性概念的稳定性理论框架.利用单李雅普诺夫(Lyapunov)函数和多李雅普诺夫函数工具
为了克服基于点距离的时间序列相似性搜索物理概念模糊和速度慢的缺点,提出时间序列的分段趋势序列(PTS)概念,并在此基础上提出一种变步长趋势子序列搜索算法.该算法基于时间
提出了移动IP中带网络负载平衡的路由问题,通过建立网络模型,采用基于矩阵编码的改进遗传算法解决问题.遗传算法采用以矩阵编码为基础的交叉算子和变异算子,并使用排序选择算
为克服传统过程监控方法需假设过程特征信号服从多元正态分布的缺陷,提出了一种新的基于独立成分分析(ICA)和主元分析(PCA)的过程监控方法,该方法由两步组成: 第一步: 利用独
分析讨论了卷染机电液张力控制系统的组成和工作原理,针对该系统存在的稳定性和精度较差等问题,提出了增加张力积分补偿环节、在张力检测环节增加液压阻尼器等改进措施.建立