基于局部相似的基因表达数据分析

来源 :复旦大学 | 被引量 : 0次 | 上传用户:zhwenh_0421
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以基因表达数据为研究对象。由于基因表达数据存在局部相似和时间延迟的特点,直接应用传统的相似度计算方法难以准确发现表达相似的基因。本文中,我们试图通过计算满足一定条件的局部相似度以刻画基因间的全局相似度,并在此思想基础上,提出基于局部相似片断组合的基因聚类方法。 本文的主要内容包括:将经典的和最新的一些相似度计算方法作出比较分析,提出基于局部最优组合的基因相似度计算方法;并就该方法在基因表达数据中的具体应用分析了其时空复杂度;最后通过实验进一步说明该方法的性能和效果。 此外,因为具有相近生物功能的基因在表达序列上具有局部相似性和时间延迟的特性,我们提出通过挖掘基因之间的局部相似信息——“模式”,利用模式信息的组合进而将基因进行聚类的新方法。最后通过比较该方法和一些传统聚类方法在模拟基因表达数据和真实基因表达数据上的运行结果说明该方法的性能。
其他文献
最近二十年由于科学技术的飞速发展,人类获取网络数据越来越容易,获取的网络数据数量越来越多,相应的网络分析挖掘技术也取得了巨大进步。之前的网络挖掘技术通常将网络看做是纯
遗传算法(GA)作为一门新兴学科,从二十世纪八十年代开始迅速发展。遗传算法是一种用于解决优化问题的并行寻优算法,已被广泛用于解决各类NP问题。但标准遗传算法仍然存在一些
随着因特网的迅猛发展,网络对一个国家的信息化和经济发展起到越来越重要的作用,然而也正是因为这样,网络成为黑客攻击首当其冲的目标;另一方面,现有的安全产品多重视外部入
P2P网络是近年来计算机领域研究与关注的一个焦点,它在很多领域都得到了应用,未来发展空间很大。但是,P2P网络发展过程中,也产生了一系列急需研究和解决的问题,安全就是其中
近年来,通信网和计算机网络不断飞速发展,给全世界的人们带来了极大的方便。同时,网络自身也变得越来越庞大复杂,对网络的管理与控制已经成为网络研究建设的重要内容之一。In
随着信息技术的飞速发展,数据爆炸和知识贫乏之间的矛盾越来越大,使数据挖掘在许多领域所起的作用越来越重要。在数据挖掘的各分支中,关联规则挖掘的研究最为深入和广泛。目前对
随着Lotus Domino群件系统的普遍应用,Domino系统的规模不断扩大,基于Domino的关键应用也不断增多。Domino系统的可用性和可扩展性就成了许多用户关注的问题。针对这些方面的
随着互联网技术和多媒体技术的快速发展,作为多媒体数据源之一的图像的资源量剧增,并且深刻影响着人们生产生活的各个领域,因此,如何高效地获取和使用图像信息,成为了当前学术界和
本文结合自行研制的新型短波监测设备,对短波传播理论、无线电测向技术、数字信号处理理论和软件无线电理论等进行了深入研究,并将其应用于设备中。首先,对无线电测向理论进
本文以企业银行住房公积金信息系统开发为例,阐述了利用基于MVC模式的Struts框架实现B/S应用系统的技术要点。 文中首先在充分分析了公积金缴存系统的用户需求之后,给出了基