基因表达数据的聚类技术研究与应用

来源 :南开大学 | 被引量 : 0次 | 上传用户:free522
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因组计划的顺利完成标志着生命科学的研究进入了的后基因组时代。科学家的研究重点转向了从大规模生物数据中发掘蕴含的结构和功能信息。微阵列和基因芯片等技术的运用使得研究者可以同时观察成千上万条基因在某个生命过程中的表达情况,从而将基因的活动状态比较完整地展现出来。基因表达分析已经成为了生物信息学研究的一个重要方向。 聚类技术将数据集根据相应特征聚成不同的类,同一类中的数据比其他类中的数据更相近。基因表达数据的聚类分析是目前生物信息学中重要的研究内容。具有相似表达特征的基因能够被聚到一起,表示具有相近的细胞功能。与此同时,同一类中相互表达的基因更有可能包含在同一个细胞过程中,这些基因的表达特征的相关性预示着它们之间的互相关。 本文研究基因表达数据分析中的聚类技术,着重研究了结合基因表达数据特征和KMeans聚类算法特点的改进算法,实验结果显示比传统KMeans的方法要好。本文还研究了聚类结果的验证方法ARI,以及从基于基因的聚类结果挖掘基因间相关性的方法。另外,本文介绍了开发的基因表达数据分析系统GeneMiner的设计与开发。
其他文献
网络学习服务支持系统(Network-Learning Support System)是网络教育系统工程的一个重要组成部分,它把各具职能的学习支持服务功能移植到网络环境中,通过学习支持服务的知识
  本文对SAT问题的随机局部搜索算法的执行轨迹进行Markov建模,并推导出算法的转移矩阵模型,分析随机局部搜索算法的通用框架,及三种算法变种:GSAT、RandomWalk、WalkSAT在选取
  本文研究了Globus的网格安全架构GSI;提出了较为灵活全面的网格计算系统安全体系结构模型;深入理解GIobus中的证书与凭证的概念,从它们的构造、原理和应用等方面进行了细致
  组播拥塞控制依据发送端数据的发送方式可以分为单速率组播和多速率组播两种方案。在单速率组播中,接收端的速率受瓶颈接收端(所有接收端中拥塞最严重的接收端)的限制;而多
  本文针对AdHoc网络的公钥管理策略展开讨论,在对现有方案充分研究和分析的基础上,提出一种基于公钥链的AdHoc网络公钥管理策略。该策略通过一个离线权威机构,解决了节点首次
论文介绍了Web服务的基本概念、发展现状和Web服务所面临的主要问题;在深入分析Web服务中信息安全相关的几个关键技术的基础上,提出由国家权威机构建立PKI体系,使得数字签名
密钥共享体制是现代密码学领域中的一个非常重要的分支,也是信息安全方向一个重要的研究内容。所谓密钥共享体制,就是这样一个协议:一个密钥分发者把一个主密钥s在参与者集合P中
为积极主动地保护计算机网络系统的安全,我们针对传统的被动型防火墙的缺点和不足进行了一些改进,将主动防御思想应用到了防火墙中,初步设计了一个防火墙的免疫模型.本文基于
本文采用了XML和JAVA语言来共同解决。JAVA语言可以操纵XML文件,在数据持久层将不同数据源的不同格式的数据统一处理成XML文件,既可将XML文件作为数据源,也可以将其转换为别
无线传感器网络(Wireless Sensor Networks,WSN)综合了嵌入式技术、无线通信技术和传感器技术等,在工业、农业、军事、医疗、家用、交通以及环境监测等领域具有广阔的应用前景。W