雌激素基因表达数据的聚类分析

来源 :南开大学 | 被引量 : 0次 | 上传用户:chenpeixin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片技术是目前研究人类基因组和其他各种模式生物基因组复杂性的最强有力的工具,这一技术已经广泛地应用于生物学和医学的各个领域。但是随着基因芯片技术的不断发展,产生的基因表达数据也在不断增加,如何有效的处理和管理芯片实验所产生的大量数据引起研究人员的广泛关注,并由此产生了众多的基因芯片的基因芯片数据分析方法。在众多的分析方法中,聚类分析因为能根据基因表达谱的相似度将基因分类,为研究人员推测基因功能和基因调控网络等提供很大的帮助,所以是目前基因芯片分析中应用比较广泛的方法。因此,针对本文所要研究的雌激素对前列腺增生影响的基因芯片,主要采用聚类的方法进行研究和分析。   论文的主要工作:通过使用具有外部标准的酵母周期数据集,来研究Silhouette指数,FOM测量在评价基因聚类分析上的能力和类数估计能力,为后面选择合适的SOM网络结构,寻找合理的类数提供一种依据。之后在对基因表达数据的预处理过程中提出对其了改进的标准化算法,即将中心化融入聚类过程中。然后在分析了常见的基因表达聚类算法的优点和不足的基础之上,提出了对其改进方法,基于类均值标准化的SOM与Kmeans聚类算法相结合的算法。通过将类均值的标准化方法融入到SOM的聚类当中来消除在聚类过程中产生的偏倚,然后采用Kmeans算法对高分辨率的SOM聚类结果进行边界的二次划分,提高了聚类的精度。   最后针对本文所要研究的雌激素对前列腺增生影响的基因表达数据,采用改进后的算法对其进行聚类分析,得到表达谱十分相近的分类,为研究雌激素在前列腺增生中的作用和分子机制提供了重要线索。
其他文献
随着软件的开发对可复用性越来越重视,软件可复用性从原有的构件复用逐步上升为整个软件体系结构的复用。本文基于领域工程的思想和研究理论,结合济南市大气颗粒物监控预警管理
网络蠕虫经常被用来盗取用户的私人信息、毁坏用户的系统和发起DoS攻击等,给网络安全造成了严重的威胁。近年来,随着P2P网络应用的不断增加,P2P蠕虫也随之迅速发展起来。由于P2P
随着移动终端设备的普及和它各种性能不断提高,人们对移动终端设备的依赖性逐渐增加,不再满足于移动终端设备简单的通信功能,而是希望移动终端设备能像普通电脑一样,通过无线通信
随着计算机技术的快速发展,语音合成技术也得到快速的发展并逐步渗透到社会生活的各个领域。但现阶段汉语语音合成中还存在一些问题,主要体现在输出语音的可懂度和自然度上。本
随着网络技术的发展和信息交换的日益频繁,信息安全技术的研究变得越来越重要。密码学发展几千年来,在社会上应用非常广泛,20世纪80年代,非线性混沌理论开始发展并且日益壮大。混
随着信息化进程的加快和网络技术的进步,人们对网络的依赖性日益提高,随之而来的安全性问题也日益严峻。在互联网环境下计算机有害程序的种类和数量急剧增加。这些有害程序利用
航迹规划是实现飞行器自动导航的一项关键技术,它是随着信息技术和航空技术的不断发展而发展起来的一门跨学科的课题研究。由于飞行器的飞行环境异常复杂,约束条件众多,航迹规划
大自然中的植物种类多样,千姿百态,它们是组成和谐大自然不可缺少的一部分。虚拟植物建模融合了计算机图形学、应用数学、随机化过程、物理学、植物学、农学及可视化计算等多
量子计算是一门交叉于数学、物理与计算机科学的前沿学科,具有令人期待的发展前景.量子计算的研究主要分为对量子计算模型、量子计算复杂性和量子算法的研究.目前,广泛引起学
伴随着互联网技术飞快的发展,一种新型的技术——云计算技术已经被广泛应用于各个领域。云计算是相继分布式计算、网格计算及并行计算之后又一大新领域的突破。云计算实质意