转录因子结合位点位置频率矩阵的聚类方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kuwa_li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
转录因子结合位点是重要的基因调控元件,转录因子结合位点的预测和识别是理解基因调控网络的关键。  针对转录因子结合位点位置频率矩阵的相似性度量函数和聚类问题,本论文的主要工作如下:  1.针对相似性度量函数的问题,本论文通过对JASPAR数据库中的转录因子位置频率矩阵构造相应的噪声矩阵来模仿生物数据中的噪声。采用各种相似性度量函数对噪声位置频率矩阵和原位置频率矩阵进行相似性比较。评测各种相似性度量函数识别出原位置频率矩阵和对应的噪声位置频率矩阵的能力,并提出了MED计算公式。通过实验结果的分析,说明本文提出的MED公式是有效的。  2.针对位置频率矩阵聚类问题,提出了MUPGMA聚类算法和基于矩阵构造共有序列算法。对JASPAR和TRANSFAC数据库进行了MUPGMA聚类,采用各种相似性度量函数计算数据对象之间的相似性,按照不同的邻近性计算类之间的相似性。通过对实验结果的分析,说明了MUPGMA算法和构造共有序列方法的有效可行性,还比较了各种相似性度量函数以及不同的类邻近性的效果。  
其他文献
复合模式查找是生物信息学中模式发现问题的一个新的研究领域,而寻求效率更高,精度更高的复合模式查找算法将是此研究领域的热点与目标。复合模式查找问题是模式查找问题的泛化
随着通信网络的广泛应用,通信网络测试技术已成为当前研究的热点。目前,大多数通信网络测试系统只能针对某类指标进行专项测试,随着通信网络的日益复杂,迫切需要一种针对多类指标
电子病历是医疗单位的医护人员对门诊及住院患者临床诊断和治疗过程的一个详细记录,其中包括数据、文字、图像、以及音频和影像等结构、非结构化信息。大多数的电子病历都是
多Agent决策仿真通过利用Agent的自治性、智能性和协作性等特点,实现对决策思维和决策流程的有效仿真,是目前研究决策行为的重要方法。而决策仿真中的知识表示问题是影响决策仿
信息技术的不断进步和网络技术的蓬勃发展,使数字图像作为重要的信息载体成为互联网信息中很重要的组成部分,图像自动分类可以有效地提高海量图像数据的管理效率降低管理难度,成
新一代航空电子系统呈现综合化、模块化的趋势,具有资源高度共享、信息快速传输、软硬件高度集成的特点,这些均对航空电子系统的信息安全性提出了新的要求。国内外相关研究机构
问答系统是一种高级形式的检索系统,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。但是传统的问答系
随着生物学中的基因微阵列数据呈现爆炸式增长,直接对这些海量数据进行认知变得越来越困难,这就出现了对能够从这些海量数据中探究其内在结构的机器学习方法的需求。如何对这些
机器人视觉系统通过视觉传感器获取环境的二维图像,并通过视觉处理器进行分析和解释,进而转换为符号,让机器人能够辨识物体,并确定其位置。  本文首先概要性的介绍机器人视觉系
片上网络借鉴了并行计算机互连网络的思想,在芯片上实现处理单元之间的互连,从而在体系结构上解决了总线结构所造成的一系列问题,逐渐成为当前最为活跃的学术课题之一。其中,路由