非负矩阵分解及在基因表达数据分析中的应用研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:yysjtu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学作为一门集计算机科学、统计学及应用数学于一体的新兴交叉学科,被用来解释和研究隐藏的生物资源,进一步揭示隐藏在大量数据背后的生物奥秘。随着科技的迅速发展,每天都有成千上万的数据被输入生物数据库。在生物信息学中,怎样从大量的基因表达数据中准确而又高效率地找出潜在的基因功能和对应基因表达水平。DNA微阵列的产生很好地解决了这个问题。其中,DNA微阵列产生的基因表达数据是最受研究人员关注的数据。基因表达数据矩阵一般具超高维小样本的特点,这给基因表达数据的分析和处理带来挑战。因此在基因表达数据分析中,选择合适有效的聚类分析和降维方法是至关重要的。本文利用非负矩阵分解相关理论来对癌症样本进行聚类分析和对特征基因进行提取。为了在降维的基础上更好地提高效率,本文提出两种改进的非负矩阵方法,并应用于特征基因提取方面。实验验证了这两种改进方法的可行性及有效性。本文研究的主要工作有:(1)非负矩阵分解在基因表达数据中的聚类分析。首先对非负矩阵分解(NMF)做系统概括;其次利用图正则非负矩阵分解(GNMF)对肿瘤样本进行聚类分析;最后用NMF,SNMF和GNMF这三种方法在肿瘤样本中进行聚类分析。(2)基于L0范数图正则非负矩阵分解算法。本文将GNMF和L0范数约束NMF的原理进行结合,提出了基于L0范数图正则非负矩阵分解算法(GL0NMF),并将其应用到基因表达数据提取中进行研究分析,最后将实验结果导入基因本体论(GO)中分析。通过与PMD,SPCA和GNMF算法对比,实验验证了笔者提出的算法在基因提取方面具有一定的可行性与有效性。(3)监督性稀疏非负矩阵分解算法。为提高NMF在基因表达数据分析中的效率,本文在稀疏控制的非负矩阵分解算法上引入类别信息,提出监督性稀疏非负矩阵分解算法(CISNMF),并将其在基因表达数据提取中进行研究分析,最后利用GO进行定性分析。通过与PMD,SPCA,SNMF和SVM-RFE进行对比,实验结果表明CISNMF算法具有一定的可行性与有效性。本文的创新点主要是提出了两种改进的非负矩阵算法:基于L0范数图正则非负矩阵分解算法(GL0NMF)和监督性稀疏非负矩阵分解算法(CISNMF)。并将这两种算法分别应用到基因表达数据提取中,实验验证了本文提出的算法在基因提取方面具有一定的可行性与有效性。
其他文献
从工程的实际需要出发,对数控机床的振动测试的流程进行了探索,并以杭州机床某数控铣床为例,围绕机床整机振动测试实验,进行了详细的阐述与说明,并对实验数据进行了分析。
小学数学开放式课堂教学是指:以充分促进学生数学素质全面发展为宗旨,以创设良好的师生关系以及教学氛围为条件,以“问题解决”为主要学习形态,自主探索与合作交流作为学习的
RNA修饰是指发生在RNA上的各种修饰形式。自然界中的RNA修饰广泛存在于A、U、C、G四类核苷酸上,此外,极少的RNA修饰发生在次黄嘌呤核苷(I)上。目前已经在古细菌、细菌、病毒
针对目前各类负面思想传播多采用定性分析,未能揭示思想传播内在规律的问题,引入病毒传播理论与数学建模的方法,提出了负面思想传播的IHSRI (Ignorant-HiddenSpread-Removed-
本文基于自身多年的教学实践和小学阶段的数学教学特点,总结出开展开放式数学教学的基本要点。这对于改变传统的数学教育模式,培养小学生良好的数学思维,养成快乐学习的习惯具有
关键共性技术协同创新是解决企业低技术水平困境的出路,通过大力发展产学研协同创新可以实现关键共性技术的重点突破,从而赶超发达国家。但是由于关键共性技术创新本身就具有较高的复杂性和不确定性,再加上创新主体产学研之间异质性的存在,导致关键共性技术在协同创新实践中面临诸多问题。本文基于对关键共性技术创新主体异质性、嵌入性以及企业技术创新绩效等相关文献的梳理与研究,首先将关键共性技术创新主体异质性划分为知识
梳理了当前防空反导系统面临的威胁与挑战,分析了国外防空反导系统发展的最新动向,总结了下一代防空反导系统的发展趋势。
本文首先从园林建设总实行新工艺的重要性入手,对其施工新工艺的管理与技术难点进行详细的分析,旨在提高其园林施工整体的质量水平,促进园林工程健康顺利的发展。
随着网络的发展和智能手机的普及,手机病毒日益增多,种类也更加丰富。手机病毒不仅破坏用户数据还盗取用户隐私,对用户造成了极大的伤害,如何有效地对手机病毒进行监测并防范成为了社会各界广泛关注的问题。由于病毒会造成手机用户的行为具有异常性,并且隐藏着一定的规律性,所以使用数据挖掘技术可以挖掘出具有代表性的手机病毒行为特征,从而能够准确且主动地检测出手机病毒。目前将数据挖掘技术应用到手机病毒挖掘中存在的问
管道内壁喷涂机器人是一种用于实现管道内部空间喷涂作业的自动化喷涂设备,表面喷涂处理是金属管道生产制造环节必不可少的一项工艺,尤其是管道内壁表面,有着防止管道内表面受输送介质侵蚀、提高管道使用寿命、降低管内粗糙度、减少压力能损失、保证管道的长期安全有效运行有着重要的作用。本文针对不同金属管道内壁自动喷涂的作业任务需要,设计了一种适用于管径变化范围为Φ600mm~Φ800mm的管道内壁喷涂机器人机械结