基于SVM-KNN分类器的miRNA表达谱分析

来源 :云南大学 | 被引量 : 0次 | 上传用户:sway6543058
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
miRNAs是一类具有调节作用的非蛋白编码的单链RNA分子,它可以调节人体内三分之一的信使RNA(mRNA)的表达。研究者的工作报告表明,对miRNA表达谱进行研究,可以区别正常组织和肿瘤组织。而且在发现肿瘤的过程中,进行miRNA表达谱的研究,有利于寻找基因治疗的新靶点,以及提高诊断和疾病预后的准确率。在这样的背景之下,本文基于miRNA表达谱数据集,提出了一种新的数据挖掘算法——TSVMKNN,从研究肿瘤组织与正常组织的分类问题着手,对特征选取和分类器的分类准确率进行分析和研究。该算法的具体思想是:首先采用t统计量方法对miRNA表达谱数据集进行特征初选,其次将一种融合了支持向量机思想和K-最近邻判别法思想的算法——SVM-KNN算法作为分类器,最后输出分类结果。实验结果表明:(1) SVM-KNN算法分类器在原理上既能继承原来各分类器中的优点,又能克服各方法中的缺点,分类能力比单独运行SVM、KNN都要好,即是可以提高预测准确率。(2)在miRNAs“标签”的数量和识别精度方面,本文所提出的TSVMKNN算法取5个信息基因即可获得96.08%的分类准确率,与同类的算法相比,具有明显的优越性。
其他文献
学位
学位
学位
微课教学是近年来伴随信息技术的不断发展而出现的一种新型教学模式,在应用之初,就展现了和传统教学的不同之处,它极大地改变着教师的教学方式以及学生的学习方式,对于提高学
学位
学位
生存分析是根据试验或调查得来的数据对生物或人的生存时间进行的分析和推断,它是用来研究被随访对象的生存时间和结局与众多影响因素之间关系及其程度大小的方法,故也称生存率
学位
学位
时标理论整合了连续和离散分析,目前很多文献只是单独讨论连续系统和离散系统上带有分布时滞的Lotka-volterra模型。鉴于此,本文研究了时标上带有分布时滞和反馈控制项的n种群L