基于图聚类的转录因子结合位点识别方法的研究

来源 :东北师范大学 | 被引量 : 3次 | 上传用户:lovely_fox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
转录因子结合位点是一段短的DNA序列,长度一般在10bp~30bp之间,它通常位于被调控基因上游的启动子区域中,转录调控蛋白与这些序列结合才能对基因的转录进行调控。因此识别转录因子结合位点成为构建转录调控网络的第一步。通常一种转录调控蛋白具有多个结合位点,这些位点在序列模式上具有相似性但又不完全相同,因此寻找一个转录调控蛋白的全部结合位点成为当今生物信息学领域最具挑战性的问题之一。本文提出一种利用图论知识对与一个转录调控蛋白结合的所有已知转录因子结合位点进行聚类从而识别未知转录因子结合位点的方法。通过对已知的转录因子结合位点进行聚类,我们可以把相似性最高的序列分到一组,对每一组中的序列构建位置特异性得分矩阵,从而得到多个位置特异性得分矩阵,把这些位置特异性得分矩阵组合在一起就形成所有已知的转录因子结合位点的混合位置特异性得分矩阵模型。我们用这个模型对训练集中的序列进行打分从而形成得分向量,用这些得分向量训练一个分类器,训练好的分类器就具有识别这种转录调控蛋白的结合位点的能力。理论上,我们的聚类方法不需要预先确定聚类数目而是根据序列之间的相似性自适应的调节聚类数,因此聚类效果比传统的聚类方法有较明显提高,另外,通过聚类得到的混合位置特异性得分矩阵模型的信息含量比单一的位置特异性得分矩阵高,因此用它给转录因子结合位点序列打分受随机事件的影响较小,分数更加可靠,训练分类器的效果更好,因此我们的方法比传统的方法更具优势。实验上,我们首先通过大肠杆菌转录因子结合位点测试我们的方法,结果识别效果比传统的位置特异性得分矩阵方法有明显提高。接着我们又对酵母的四个转录调控蛋白的结合位点序列进行试验,结果表明,使用我们的方法进行转录因子结合位点识别,在识别的敏感性和特异性上均比传统的位置特异性得分矩阵方法有较大提高,从而说明我们的方法在转录因子结合位点识别上是有效的。
其他文献
近年来,在青海省海南州共和县西香卡地区马骡流行一种以结膜炎为主要特征的眼病,发病率高,传播快,使役能力降低。为了有效地防治该病,笔者进行了流行病学调查、细菌学检查和临床治
本文根据物质世界的客观实在性说明地震发生的规律具有可探索性,认为应加强地震各学科间的相互渗透,以提高预报水平,增强地震预报系统的开放性。目前,尤应重视“感性材料”的获取和提炼。
近几年,"单元整体教学"成了一个热点词。笔者发现不光在英语学科,在语文学科也同样提倡教师的整体教学观念。本文以译林英语六年级上册U1 The king’s new clothes教学设计为
六氯苯磺酰替苯胺是苯磺酰替苯胺氯代衍生物的一种,为银灰色粉末,不溶于水,可溶于丙酮、乙醇、甲苯等多种有机溶剂中。其商品名为肝虫净。目前用于临床驱杀肝片吸虫药物的种类繁
为了探索一种简便、高纯度分离子宫内膜腺上皮细胞和间质细胞的方法,以及建立高纯度体外子宫内膜细胞培养模型,该试验将原代细胞的3种培养方法,即组织块贴壁法、胰蛋白酶消化法
背景及目的正畸治疗过程中,牙齿移动与牙槽骨改建密切相关。研究表明:在接受正畸治疗的成人患者,特别是绝经后的老年患者中,由于雌激素缺乏和增龄变化导致其出现不同程度的骨
本文主要A股市场引入融资融券制度带来的影响入手.通过分析做市商制度的功能,解释做市商制度如何稳定市场在做空机制出现后的波动.
<正> 1970年10月29日14时32分49秒,金湖县卞塘乡一带(北纬32&#176;54’,东经119&#176;06’),发生了(Ms)4.2级地震,震源深度15公里,震中区位于金湖凹陷南部,这是苏中地区现代
试验回收中等卵泡(2~6mm)中的A、B级卵母细胞,然后把卵母细胞分为12组移入培养液TCM-199进行体外成熟培养。A组在不同培养时间(30,36,42,45,48,51h)和B组在不同培养时间(32,38,44,47,50,53h)用H
目的:观察分析影视阴道镜检查在子宫颈病变诊断中的临床应用价值。方法:随机从我院门诊行阴道镜检查的2000多例患者中选取500例,采用随机数字表法将所有研究对象分为研究组和