面向肿瘤亚型识别的基因表达谱非负矩阵分解聚类方法研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:yanguangkai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会随着人们生活水平的提高以及生活习惯、饮食习惯的改变,肿瘤的发病率和死亡率在不断上升,已成为威胁人类健康的最主要疾病。肿瘤早期的诊断和个性化治疗是减少肿瘤患者死亡率的最有效方法。随着生物技术和生物信息的不断发展,基因芯片技术也迅速发展了起来,该技术是一种在单一的试验中能够检测成千上万条基因、甚至整个基因表达水平的最强大的方法。过去的几年里,这种技术已经被广泛应用在如肿瘤分析、新药物发现及不同条件下细胞行为的分析等。由于该技术在生物领域的广泛使用,目前积累了大量的基因表达数据集。怎么样对这些海量的基因表达谱进行分析及挖掘出其中隐藏的信息,是当今生物信息学的一个研究热点。基因表达数据呈现维度高、样本小的特点。基因表达谱聚类是该类数据分析的一个主要任务,其目标是根据样本在基因表达上的相似性自动实现样本数据的聚类,被用于肿瘤(亚型)识别的聚类之中。该方法是一种无监督的学习方法。在基因表达谱分析中一直是一个热点研究问题。然而,如何选择相似性度量标准以及更有效的挖掘数据中的局部信息,并且应用恰当有效的算法来进行聚类分析研究依然是个亟待解决的难题。由于基于非负矩阵分解(Non-negative Matrix Factorization, NMF)聚类方法具有较好的可解释性,本文主要面向肿瘤基因表达数据聚类,研究基于NMF的基因表达谱聚类。本文主要从以下几个方面对其进行研究:1.将图正则化的非负矩阵分解(Graph Regularized Non-negative Matrix Factorization, GNMF)方法引入到肿瘤基因表达谱聚类分析中,该方法是一种近邻保持的非负矩阵分解方法,其采用图的拉普拉斯正则化约束实现了数据在原空间和分解空间的近邻保持。实验结果显示:在面向肿瘤亚型识别应用中,该方法优于已有的非负矩阵分解方法。2.考虑到不同基因与不同肿瘤亚型相关联,我们需要在对样本进行肿瘤亚型识别的同时,发现与特定肿瘤亚型相关的关键基因。因此,我们将双向图正则化的非负矩阵分解(Graph Dual Regularized Non-negative Matrix Factorization, GDNMF)方法引用到肿瘤基因表达谱聚类分析中,该方法同时考虑数据流形的几何结构和特征流形的几何结构,对非负矩阵分解过程中的数据近邻分解保持和特征近邻分解保持进行双向图拉普拉斯正则化约束。实验结果表明:该方法不但能有效地对肿瘤亚型进行聚类,同时还能识别出肿瘤亚型对应的关键基因。
其他文献
专用短程通信(DSRC,Dedicated Short Range Communieation)是智能交通系统(ITS,Intelligent Transport System)领域中专门用于机动车辆与路边设备交换信息的协议。DSRC系统分
信息技术的发展使得利用计算机系统作为犯罪的工具或目标的案件在司法案件中逐年增多,因此电子证据成为越来越多的诉讼证据,如何能有效地获取电子证据日益成为一个迫切需要解决
近年来,无线传感器网络的发展引起了人们越来越多的关注。“物联网”“普适计算”等和无线传感器网络相关联的新名词接连出现;ISO/IEC JTC1国际传感器网络研究组(SGSN)和ISO/IE
短文本通常指文本长度小于160个字符,一般以手机短信、网页评论、网络聊天信息等形式存在的文本。短文本的分类问题是短文本应用领域必须解决的具有挑战性的基础问题之一。由
随着计算机技术、多媒体技术、网络通信技术的发展,网络教育以其特有的教学模式、丰富的教学内容与方法得到越来越多教师与学生的欢迎。计算机测试系统是网络教育发展中的一
随着信息时代的来临,数码相机、摄像机等电子产品已走入千家万户,人们可以方便地获取到高分辨率的数字图像。为了信息传递、共享和交流,需要能够在手机、PDA、MP4等小屏幕的移动
人类的虹膜具有唯一性、稳定性、不可改变性和高度的抗欺骗性,因此基于虹膜的生物识别技术广泛应用于安全控制和电子商务等许多领域。随着虹膜识别技术的日益进步,人们对识别
电力的安全运营是其他行业正常运转的基本保障,为了保证电力供应,需要对电力供应相关的备品进行储备。电力行业的分散布局决定了备品分散在各个执行机构不能集中储备,由于没有面向全局的规划储备方案,备品大量重复储备,占用大量流动资金并消耗大量保管费用。同时由于设计时没有统一规划,使得备品信息成为‘数据孤岛’,备品储备信息无法共享,在应急维修中不能快速的找到相邻单位的空余设备来完成紧急任务。为了降低运营成本,
近年来,计算机犯罪一直是有增无减,严重影响到社会的安定,计算机取证是有效打击计算机犯罪的重要手段,其关键在于保证提取的电子证据具有法律认可的证明力。   与传统证据相比
语音合成技术是人机交互研究中比较重要的技术之一,并且已经应用到了社会生活的许多领域。语料库构建技术作为语音合成技术开发中的一个重要模块也受到研究人员的普遍关注。