基于多数据集的胃癌亚型标志基因选择

来源 :北京工业大学学报 | 被引量 : 0次 | 上传用户:lanke0022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于机器学习方法分析胃癌微阵列数据,寻找和发现新的胃癌亚型分类的相关基因,可为进一步研究胃癌发生的分子机制及其基因水平的诊断和治疗提供标志与依据.现有方法大多使用单个数据集提取特征基因,样本量少,提取的特征基因应用于其他同类数据分类效果差.本文提出了一种遗传算法与支持向量机(support vector machine,SVM)相结合的特征基因提取方法,并行分析了3个胃癌微阵列数据集,提取的特征基因在所有数据集中均达90%以上的分类准确率.进行了4 580次实验,统计基因在遗传算法种群中出现的次数依次排序,得出了可能对胃癌亚型分类起关键作用的基因(AGT、FBLN1等).对提取的特征基因的生物学意义分析结果表明,本方法能很好地识别胃癌亚型分类基因,所选择的特征基因对人类胃癌肿瘤的诊断和分型有重要意义.
其他文献
xPlane是基于VB编写的绘制三维晶体形态及其投影的计算机软件。对软件的几何原理、算法以及数据的输入和输出进行了简单介绍。在表现晶体的立体形态时,仅要求输入点群、晶胞
房地产行业是我国经济发展的支柱型产业,受到政府、社会、民众多方关注,在过往相当长一段时间里受住房政策及城镇化人口增长红利、市场预期等因素的刺激性影响下高速发展。随
在露地和大棚条件下研究了5种不同有机肥对生菜硝酸盐积累的影响,结果表明:无论露地和大棚,不同有机肥对生菜单球质量和硝酸盐积累的影响都达极显著水平,施用牛粪和生物发酵
<正>引导自学法是指在教师的引导下,学生自觉进行学习,自主获取知识,自我提高学习能力的一种教学方法。这种教学方法要求教师的教学行为由"带着知识走向学生"转变为"带着学生
甲壳类和鱼类是消费者喜爱的水产品,但是国内外甲壳类过敏和鱼过敏现状均不容乐观,对消费者的健康和生活水平造成了一定程度的伤害。原肌球蛋白和精氨酸激酶是甲壳类两个主要
<正>街舞啦啦操是一个快节奏的舞蹈,它以街舞的舞蹈元素为基础,同时又结合了啦啦操的项目特征,在近几年的舞蹈啦啦操运动中得到了快速发展,并且总能以其独特的魅力吸引观众的
<正>全球范围内对于合理的剖宫产率仍处于探讨阶段。2012—2013年英国总体的剖宫产率为25.5%[1],其中急诊行剖宫产(14.8%)所占比例较择期行剖宫产(10.7%)高。对有剖宫产史产
<正> 新疆维吾尔自治区教委高校历史材料编写组编写大32开271千字定价4.90元新疆大学出版社出版该书由自治区教委组织高校和社科院各族历史学专家集体编写。该教材以马列主义
以黄河三角洲为例进行了区域生态风险评价理论和方法的探讨。针对黄河三角洲主要生态风险源洪涝、干旱、风暴潮灾害、油田污染事故以及黄河断流的概率进行了分级评价 ;并提出