基于遗传算法与支持向量机融合的特征基因抽取方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:baiseshiren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片技术是联合了生命科学与信息科学这两大学科研究成果的一项崭新技术,现在已成为大规模提取和探索生物分子信息的高效方法之一。同时基因芯片技术也逐渐成为生物信息学中最为广泛应用的技术之一,它的主要应用是同时测量一个细胞样本中数以万计的不同基因的活动情况。基因芯片技术为基因诊断和基因治疗的诸多应用提供了很好的前提条件和可能性。目前,微阵列技术已被广泛应用于基因表达水平的录制实验。所获得的基因表达数据通常包括上万条基因的测量值,很多传统方法在处理这样高维度、低样本数的数据时都存在着效率问题。由于微阵列实验所获得的数据集常含有较少的组织样本,而每一组织却包括上万条基因的表达水平,并具有高信噪比和基因间的高相关度,大多数有监督的方法应用效果并不理想。本文将实现一个遗传算法与支持向量机的融合算法以进行特征基因抽取。这一融合算法的目标是结合两种算法的各自优点,确定对目标样本分类所需特征基因的个数和如何选择这些特征基因。在此融合方法中遗传算法作为搜索引擎,主要作用于特征抽取的特征搜索过程,过程中涉及变异及交叉过程的参数选择均采用自适应方式确定。支持向量机作为分类器,检验所选择特征基因的分类准确度,并由此产生遗传算法进化的适应度值,适应度值越高的个体进行变异和交叉的概论越小,群体的整体适应度值逐步提高。本文采用了弥散大B淋巴细胞数据与0.05显著性水平t检验的前列腺癌数据集,实验验证该融合算法在处理高维度的微阵列表达数据中的性能与特性。采用自适应参数的融合算法可以达到较高的分类准确度,并且具有较理想的收敛性。经查阅NCBI(美国国家生物技术信息中心)的生物学相关文献,可证明该融合算法获得的基因子集具有重要生物学意义。
其他文献
在石油勘探工程领域,测井图纸是一种被广泛使用的测井资料。工程图纸数字化是将纸介质工程图纸扫描输入计算机后,对所得的扫描图像加以分析、识别,最终重建其中的目标对象的
Web服务技术作为程序设计领域中的一项新技术,能够使不同的平台具有互操作性,通过遍布全球的因特网,实现应用程序之间的远程过程调用。但单一的Web服务已经难以满足日益广泛
随着科学技术的不断发展,嵌入式系统在工业控制和智能家电领域得到了广泛的应用,同时控制逻辑和功能也变得越来越复杂,因此,简单的嵌入式系统已经不能满足这种需求,为了解决
虚拟人足迹规划和路径规划是虚拟人技术中很重要的研究内容。通过调整足迹来控制虚拟人的落脚点,进而可以驱动虚拟人的行进动作。路径规划则可以为虚拟人在虚拟环境中规划一条
逻辑推理是人工智能的基础,而逻辑中的一阶谓词逻辑是使用较为广泛的知识表示方法,因此研究一阶谓词逻辑的推理问题是一项很有意义的工作。在前人研究的基础上,借助Petri网中的
近几年来,随着云计算的快速发展,服务提供商越来越倾向于将本地数据部署到云上。然而,一些安全方面的问题随之而来,一方面,云数据提供商不希望自己的数据被云服务提供商窥视,
为保证有效合理地施用农药防治农作物病害,农业生产者必须准确的获取作物的生长信息,这样,农业生产者可根据获得的病害信息快速、准确的诊断受害作物的病因以及受害程度,因病治宜
随着生产力水平的提高,农业信息化现以成为我国农业发展的主要方向。近年来,越来越多的人工智能技术被应用到智能决策支持系统(DSS)的研究与开发中,以期改善问题求解的过程和
本文详细介绍了网格操作系统中资源监测服务的研究与实现。通过对网格操作系统的深入研究,发现网格操作系统虽然能够管理上千台计算机协同工作,但用户却无法查看整个机群的运
数据挖掘是从大量数据中提取出有效的、新颖的、有潜在作用的、可信的、并能最终被人理解的模式的非平凡的处理过程。序列模式挖掘作为数据挖掘的一项重要研究内容,用于从各