基于SVM的肿瘤特征基因提取与基因表达数据分析

来源 :重庆理工大学学报(自然科学) | 被引量 : 0次 | 上传用户:wwxx10086
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于支持向量机的肿瘤基因表达谱数据挖掘方法。首先采用信噪比方法对白血病、结肠癌、肺癌数据提取特征基因,生成特征基因子集。然后通过支持向量机分类模型对特征基因子集进行机器学习训练分类。实验结果表明:急性白血病、结肠癌只需4个特征基因,均获得100%的10折交叉验证分类准确率。最后为了有效地排除噪声基因进而挑选出精确度更高的分类特征基因,采用多尺度小波阈值法对肺癌数据进行降噪处理,降噪后仅需5个特征基因获得96.61%的分类准确率。 A new method of mining tumor gene expression data based on support vector machine is proposed. First, the signal to noise ratio method for leukemia, colon cancer, lung cancer data extracted characteristic genes, generate characteristic gene subset. Then, the machine learning training classification of feature gene subsets is carried out by SVM classification model. Experimental results show that: acute leukemia, colon cancer only four characteristic genes were obtained 100% 10 fold cross-validation classification accuracy. Finally, in order to effectively exclude the noise gene and then select the more accurate classification of the characteristics of genes, using multi-scale wavelet threshold method for lung cancer data denoising treatment, only five characteristic genes after noise reduction 96.61% of the classification accuracy.
其他文献
<正> 本文介绍的电子门铃,设计新颖,具有对习惯按门铃与连续短促按门铃的两种识别触发功能,并相应发出两种音乐或音响信号通知家人。这种电子门铃对来访客人与家人有初级的识
【目的】温室大棚中蔬菜的人工移栽存在工作量大、稳定性差、操作复杂等问题,劳动力成本占据蔬菜生产成本的50%以上,研制全自动温室大棚钵苗移栽机可提高劳动生产率、保证秧
目的观察咪达唑仑与地西泮在心脏择期电复律中镇静的治疗效果,探讨其护理措施。方法选取2010年5月-2012年5月就诊于福建医科大学附属第一医院,确诊为快速性心律失常的患者60
<正>"设计的内涵就是文化",这是国际著名汽车设计大师乔治·亚罗的观点。显然,文化是设计理念产生之源,形式和风格是设计理念的视觉表现,体现了设计的文化内涵。所谓设计是文
篮球作为我国高校体育教学中的一门重要体育项目,受到了很多大学生的欢迎。在现阶段我国高校体育改革工作不断深入的大背景下,高校篮球教学改革也势在必行。通过概述当前我国
为了确保变电所的安全运行,在操作上设置电气闭锁或机械闭锁系统,已成为防止误操作等事故发生的有效而可行的手段。
目的探讨糖化血红蛋白和糖蛋白抗原15-3(CA15-3)水平与女性乳腺癌发病风险的关系。方法收集2016~2018年107例确诊为乳腺癌的女性患者,选取年龄相匹配的110例女性体检者为对照
【正】 A.围绕婚姻价值观的变化“丈夫搞了情妇,向作为妻子的我提出离婚。丈夫的要求也不会得到批准。但是,我想利用这个机会,同背叛了我的丈夫离婚而自立。丈夫找了个他所喜
患者,男,42岁,农民,贵州锦屏县人。17岁时曾食未煮熟的蛇、青蛙肉等。2002年始,自觉周身不适,偶有头部胀痛,下腹部麻木及刺痛感。2006年8月自觉症状加重,时而难以忍受.同时发现左侧下
应用 SOLGAS 软件对钛铁矿炭还原过程进行了不同条件下各种还原产物的热化学平衡组份的计算,重新考察了钛铁矿炭热还原的历程;通过高温炭热还原试验,测定了该过程的还原速率;