基于最大团求精的模体发现算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:dvvicky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
转录因子结合位点是与转录因子结合的DNA片断,负责启动基因的转录过程和控制基因的转录效率。由于转录调控是基因表达调控的关键环节,因此转录因子结合位点的预测和识别对于生物调控网络的研究具有重要意义。本文在研究模体发现算法的基础之上,发现了植入模体发现问题与最大团问题之间的相关性,将植入模体发现问题形式化为在无向图中求解最大团的问题,并且提出了一种利用最大团解决植入模体发现问题的算法。基于缩小解空间规模和加速最大团收敛速度的目的,本文提出了一种基于最大团求精的随机投影植入模体发现算法。该算法通过随机投影策略产生若干合格桶,并对所有的合格桶施加一个基于回溯法的最大团扩充求精过程,可以得到一组候选模体,最终将能够使目标函数值最大的模体作为最优解输出。本文解析并给出了随机投影参数的选择对基于最大团求精的随机投影植入模体发现算法的影响。使用一致序列得分和相对熵两种测度对候选模体进行筛选,并通过性能系数和互相关系数等评价测度对算法的最优解质量进行了评价。本文通过模拟数据对算法的有效性进行了验证,并且将所提出的算法应用于不同物种生物数据的转录因子结合位点识别,尤其是酿酒酵母的多组转录因子结合位点的预测能够达到80%以上的识别率。
其他文献
近年来,游戏和电影行业的快速发展使人们对高质量真实感图形的需求不断增加。因此,如何更逼真、更高效地绘制三维场景是当前真实感图形学研究的热点。为了提高光线跟踪的绘制
伴随着计算机技术、网络技术和远程通信技术的不断发展,电子交易得到急剧发展,电子交易中的安全问题也日益备受关注,对网上电子交易的安全与便捷提出了更高的要求。本文针对安全
受限域问答系统是自动问答系统的一种,相对于开放域问答系统更具实用性和可行性而成为自然语言处理领域的研究热点。受限域问答系统通常包含三个部分:问句分析、信息检索和答案
多维尺度分析(Multidimensional Scaling,MDS)是一种传统的多元统计方法,自提出以后的数十年来,随着研究的不断深入,应用范围越来越广泛。目前,学界对MDS的应用研究仍旧处在一种非常
随着地理信息系统(Geographic Information System,简称GIS)的用户数量和传输数据量的增加,空间信息在线服务系统面临着许多挑战:海量空间数据的网络传输导致系统的响应时间
随着科技的进步和发展,无线传感器网络正逐渐的应用到社会的各个行业和领域。无线传感器网络是一种不确定网络,在布署时其网络拓扑无法提前预测,节点随机分布在一定空间区域内,空
复杂网络已经渗透到了我们生活的各个方面和领域了。网络抗毁性是网络可靠性的一个静态指标,排除了网络固有属性的干扰,从网络拓扑结构角度对网络可靠性进行分析,是网络可靠性研
对数据聚类的研究有很长的历史,几十年来,其重要性以及与其他研究方向的交叉特性得到人们的肯定。然而,细胞自动机在数据聚类方面的研究却相对较少。本文研究了细胞自动机与蚁群
军事信息的安全保密是部队工作中的重要问题,采用以加密算法为核心的密码技术对信息加密是最常用、最有效的安全保护手段。在我们二炮部队,需要用先进的加密技术保护的信息和数
油田开发动态分析,在整个油田开发生产过程中,具有重要的地位。搞好这项工作是保证科学高效地开发油田,保持油田高产稳产,提高油田最终采收率的基础。由于油田开发动态分析工作本