基于改进的BPSO和支持向量机的特征基因选择方法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:hsjxln
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  随着微阵列芯片技术地广泛应用,科研人员能够在较少的实验中完成对物种大量基因表达水平值的检测,这为从分子水平上探索疾病的发病机理、临床诊断与治疗,了解生命的生长生活过程奠定了殷实的基础。但是,原始获取的数据具有高维、高噪、高相关、小样本特点,分析这些数据并从中筛选和疾病相关的关键特征具有重要意义。   本文基于群智能算法和统计学习理论的知识,在分析肿瘤基因表达谱特征的基础上,研究了肿瘤分类特征基因选取问题;提出两种改进的粒子群算法使其具有良好的局部搜索与全局搜索能力,并成功运用到基因特征选择方法中获取了有效特征子集。一种为混合多变异位自适应遗传算子操作的二进制粒子群算法。我们引入改良了的遗传算子操作到粒子群算法,其中,采用多位变异位来增加种群的多样性,同时,我们选取自适应概率的交叉、变异操作,更好的寻优满意解。另一种改进的粒子群算法中,我们引入基本遗传算法的交叉和变异策略到粒子群算法增加搜索可行解范围,避免粒子的早熟收敛;同时选用免疫算法的疫苗机制有效地削弱基本遗传算子操作带来的种群退化风险。文中首先采用Wilc oxon秩和检验指标来对分类起较大作用的预选特征子集,然后结合广泛应用于小样本分类的支持向量机为分类器的改进粒子群算法对预选子集实施筛选。两种方法中适应值函数均采用带权系数的策略来权衡子集数量和分类准确率在最优化子集中的比重,同时,方法二中支持向量机分类器的参数选用了自适应调整策略。在两个公开的基因表达数据集上的实验仿真数据以及对选定特征的生物学分析显示本文提出的方法是可行、有效的,对医学工作者诊疗疾病具有实践指导意义。
其他文献
主元分析PCA方法是一种被广泛应用的过程监测方法。它能够从高维数据中提取出最主要的信息,实现数据的降维,从而简化分析过程,实现对过程的有效监测。对于实际工业生产过程,
无线传感器网络是一种新的信息获取和处理技术,是国内外研究的热点,有着广阔的应用前景。在无线传感器网络中,分布在观测环境中的传感器节点的能量是有限的,因此,无线传感器网络路
随着信息技术在教育领域的深入应用,数字化教育已成为现代教育的重要组成部分。各种教育资源平台的出现满足了人们对教育资源日益增长的需求,同时,也改变了人们获取教育资源
文本分类在信息检索、文本过滤、文档组织等多个领域有着广泛的应用。在文本分类中,通常用特征词向量来表示文本数据,由于特征词较多导致文本数据的维数过高,经常达数千甚至数万
在社会老龄化和慢性疾病成为死亡主要原因的事实基础上,e-health/m-health成为一个技术或者产业热点。在过去的20年里,老年人健康居家监测设备快速发展,比如智能相机,跌倒探测器等,这些监测设备使用各种信息通信新技术,从雷达、红外到电磁器件[1]。这些设备的目的是定义一个定量框架,来判断显著偏离正常的行为方式,在居家环境中确定产生病理症状或发生紧急状况(例如,呼吸困难、跌倒)。除此之外,随
电子病历是医院信息化进程中的必然趋势。我国的医院信息系统正向着以病人为中心、高度集成化和多媒体化的方向发展。电子病历作为医疗卫生信息化的核心内容之一,新的尝试和运
降质图像的存在使得图像复原成为机器视觉的一个重要研究领域,其中雾天模糊图像和散焦模糊图像是最为常见的降质图像。目前关于雾天图像和散焦图像的复原方法有很多,取得的效果
随着机器视觉的发展,物体的三维重建技术日益显得重要。近年来,双目立体视觉测量方法得到了飞速的发展,该方法具有效率高、精度高、成本低等特点,非常适用于制造业现场的在线
随着微电子、无线通信技术的日趋成熟,无线传感器网络技术也得到快速发展。而在无线传感器网络广泛应用的同时,其所受到的安全威胁也越来越多。传统的基于密码机制的安全防御
计算机辅助检测是利用计算机学习人类的经验,达到自动化的辅助诊断病症。随着机器学习技术的发展,应用的领域不断扩展,它与医疗图像相结合的计算机辅助诊断成为研究的热点。