基于2DEPCA与RGS-SVM的肿瘤基因分析方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:haohaodezuzut
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肿瘤是当今威胁人类生命的主要病因之一,如何识别和诊断肿瘤是所有研究人员关注的焦点。随着生物信息技术的发展,从基因表达谱中提取出致病基因已经成为肿瘤治疗和预防的主要手段。特征提取是数据挖掘中一种非常有效的手段,但是由于基因表达谱中的基因表达数据常常具有高维、高噪和高冗余的特点,大大降低了特征提取方法的性能,并导致方法的复杂度急剧上升。因此,设计一种有效的特征提取方法在肿瘤诊断中显得格外重要;此外,在基因的分类过程中,分类器的选择和构造也对分类结果影响甚大,好的分类模型不仅可以提升分类精确度,还可以提升分类效率。因此,本文针对基因分类过程中的特征提取和分类模型分别进行了改进,提出了改进两种方法。本文主要的研究工作如下:(1)传统的特征提取方法一般都没有充分利用基因之间的相关性和结构信息特性,致使分类的总体性能不高。因此,本文尝试将原用于图像识别领域的2DPCA算法引入到特征基因选取上,并且针对2DPCA存在的冗余性高的缺陷,提出了一种基于信息熵的2DPCA特征基因提取方法(2DEPCA)。该方法的思想是:首先将用于热力统计学的熵信息引入到基因表达数据的特征子集的初选中,然后再将初选之后的特征基因进行二维主成分分析。实验结果表明,2DEPCA在保证分类的准确度的前提下,有效的降低了数据的冗余性,提升了特征提取效率,实验中将2DEPCA方法与相关特征提取方法进行分析对比,最终也验证了2DEPCA方法的可行性和有效性。(2)针对SVM训练时寻参效率低的问题,在传统寻参的网格搜索方法的基础上提出了基于SVM的自适应的肿瘤分类方法(RGS-SVM)。该方法的基本思想是:通过将折半查找和迭代的思想,缩短了搜索的范围,提高寻参效率,最后通过六组数据集的实验分析,该算法与传统的自适应分类算法相比,在分类准确率提高或保持不变的前提下,大大降低了搜索时间。
其他文献
教育部2009年3月颁布了《关于做好全日制专业硕士专业学位研究生培养工作的若干意见》对研究生的培养类型做了重大调整。“为了更好地适应国家经济建设和社会发展对高层次应
本文以“仪式感”和“现代性”两个基本概念为核心,主要讨论仪式在现代性演进过程中,其“神圣性”或“道德性”是否还存在,以及“仪式感”如何在信仰价值普遍衰落的今天,继续
目前,我国蓝色国土教育是一个相对薄弱的环节.通过对师范生调查,了解他们的海洋知识、海洋意识、海洋预期行为情况,以便为师范院校开展蓝色国土教育提供参考.
本文以社会冲突性议题建构中的媒体公共性为研究对象,对社会冲突性议题如何进入公共话语空间、媒体建构社会冲突性议题的公共性框架以及在建构过程中所呈现的媒体公共性及其
目的:改革教学方法,探讨小组合作学习在护理教学中的应用和效果。方法:以2014级280名护理大专生为研究对象,在护理管理学教学中采用小组合作学习法,以问卷调查评价其效果。结果:课
传统C语言课程教学方法在课程教学后的下学期进行课程设计,实践同理论联系程度差,过分看重语法教学,对程序设计思想的教学力度弱,学习效果差。因此,研究了基于计算思维的程序
针对20CrMoH汽车齿轮用渗碳钢在普通正火中冷却速度不一样而获得的显微组织和性能不理想的问题,通过对比分析,解决了采用等温正火工艺在一个较宽的温度范围内,可获得最佳的显
煤炭资源开采所形成的大范围地下采空区是影响煤矿生产和工程建设的安全隐患,其有效探测和稳定性评价是学术界研究的重要课题。地下采空区的“空洞”效应会导致重力场发生变化,通过地表重力测量可揭示采空区的演变特征,但长期以来,这种重力异常效应因量级较小而被多数学者所忽视。本文从高精度重力测量实验入手,采用数值模拟和实验验证的方法分析采空区地表重力异常效应,探索基于重力异常数据反演采空区稳定性的技术途径。主要
多酚类化合物在葡萄酒颜色、口感、稳定性等方面具有重要作用,影响葡萄酒的质量。研究多酚化合物单宁对提高葡萄酒质量具有深刻的意义。现简要论述多酚类化合物单宁以及其对
【正】 恩格斯最伟大的功绩是他同马克思一起,把社会主义由空想变成了科学。特別是晚年,恩格斯总结了共产主义运动中的经验教训,就社会主义运动的实践和发展提出了更进一步的