基因表达谱数据的挖掘研究

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:chinacode007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片技术的出现使得研究者可以同时分析上万个基因在各种生理状态或不同的发育阶段的表达情况以揭示它们的功能和相互之间的作用关系。目前,该技术已经被广泛地应用于医学疾病诊断和治疗,药物筛选和鉴定、农作物育种、环境监测等领域。面对海量基因表达谱数据,如何利用这些数据研究基因间的调控关系成为当前生物信息学的一个重要领域,使用数学模型对基因表达数据进行挖掘已成为研究热点。本文针对基因表达谱数据提出了几种数据挖掘方法,并对珊瑚基因的时间序列表达谱数据进行了深入分析。在第一章,论文简单地介绍了基因芯片技术,分析了目前基因表达谱数据挖掘的研究现状,概括了本文的主要研究工作。在建立基因逻辑网络时,需要知道基因是处于“表达”还是“抑制”状态,而数据库中给出的表达谱数据只代表基因的表达水平并未给出确切的表达状态。因此,在第二章中,我们给出了一种基于遗传算法和LVQ网的基因表达数据阈值分析方法。对于小的数据集,直接用遗传算法优化的Otsu算法找出阈值并给出二值分类结果。对于大的数据集,先选出它的一个子集,并用遗传算法优化的Otsu算法对其进行处理;然后,将处理结果后作为遗传算法优化LVQ网络的训练集对网络进行训练;最后,用训练好的LVQ网络对大数据集进行二值化分类。基因的时间序列表达谱是一种非平稳的信号,这种非平稳的信号中含有大量信息。为了更好地挖掘基因表达谱中的信息,在第三章,我们先通过数据预处理和差异基因筛选找出表达差异大的相关基因;然后对这些表达差异大的相关基因的时间序列信号做离散的小波变换得到相应的频域信号,再利用这些相关基因的频域信号进行基因之间的相关分析,构建这些基因之间的一个无向网络,通过相关度数分析寻找关键基因;最后通过关键基因的基因功能注释挖掘出基因时间序列表达数据的生物学信息,即找到与造礁功能密切相关的关键基因。在文章的最后,对基因芯片技术和基因表达谱数据的挖掘方法作了一下展望,并且提出了下一步研究的方向。
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
本文以“貝”部字為視點,綜觀整部《說文》,不僅從釋義、書例、重文等方面分析了已收入《說文·貝部》中的字,而且還將未收入《說文·貝部》而字形與“貝”有關的字收集整理出來
综述了近10年无机膜的制备工艺、改性及成膜机理方面的研究进展。制备工艺包括溶胶一凝胶法、化学气相沉积法、阳极氧化法、磁控溅射法、喷雾热分解法等。成膜机理主要包括化
随着互联网的发展进步与网络用户数量的激增,作为人类生活的"第五空间"——网络空间,其发展速度可谓是日新月异,网络空间对于国家与国际的影响也越来越明显。在网络空间治理
电力信息技术与电力通信技术,是当前电力系统运行过程中不可或缺的重要技术类型。电力信息技术与电力通信技术的有效融合,有利于增强电力系统的安全性与稳定性。文章论述了电
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
对某轮主机曲轴断裂问题从机架、主轴承结构刚性、镀铁层特性、主轴颈与主轴承硬度匹配几方面进行了较深入的分析 ,并提出了改进意见
<正>本刊讯9月1日,中国建材集团蚌埠玻璃工业设计研究院与北京大学纳米化学研究中心合作共建功能玻璃材料研究中心签字仪式在京举行。中国建材集团董事长、党委书记宋志平,北
期刊