基于基因表达谱的基因挖掘算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:nanfangjituan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因基因芯片技术的快速发展,生物学在研究方式上发生了巨大的变化,慢慢地由原来的基于实验的定性研究向基于数据的定量研究靠拢,生物信息学应运而生,为传统生物学注入了强大的动力,特别是近几年围绕微阵列芯片展开的广泛而深入的研究,淋漓地展现了计算机和数学等工具在解决生物问题时的强大威力。本论文的研究方向是生物信息领域的基于基因表达谱的基因挖掘。研究内容和取得的研究成果主要包括五个方面。第一,对相关性理论和特征基因挖掘理论及其方法进行了总结。第二,提出了一个度量基因集合表达差异性的测度FLDT,该测度将fisher线性分类与t-statistic相结合,不但能够给出基因集合整体进行评价,而且同时能够对集合中每个基因的进行评价。第三,在传统的基于决策树的集成基因挖掘算法中,样本空间中的分类平面必须与坐标轴平行,大大限制了该算法的性能,针对此,本论文中提出了一种改进算法,该算法利用基因集合的FLDT测度的独有特性,实现了节点包含的基因数目可以是小于N(N的值由用户指定)的任意数目的改进,提高了原算法的灵活性和分类能力。第四,目前存在大量的基因挖掘的方法,对于这些算法的评价渐渐也成为一个研究方向,目前提出的各种评价方法,大多是采用数学分析和随机模拟的方法,本文提出了一种基于准相关基因集合的评价方法,并基于此提出了一个多个基因排序相融合的算法IndexFusion,该算法可以通过多个基因排序得到一个较优的融合排序。最后实现了一个相关基因挖掘系统,该系统包含本论文中提出的所有算法和其他文献中出现的其他一些方法。
其他文献
随着Internet/Intranet的日益普及,Web已成为共享和传播信息的主要渠道之一,UML建模语言、RUP统一过程、XML信息交换标准、.NET架构、Web Service、JavaScript脚本、组件技术
同时多线索SMT(Simultaneous Multithreading)体系结构在每个周期内允许有多条独立的线索发射指令。这样,处理器内部就存在有多个同时活跃着的上下文,它们每个周期都会竞争处
虚拟细胞是在计算机上模拟真实细胞的结构、物质组成、生命活动的动力学行为和生命现象。虚拟细胞的发展虽然只有十几年的历史,但是它对疾病防治、科学研究、社会生活等方面
MIMO-OFDM系统内组合使用两种关键技术:多输入多输出(MIMO,Multi-Input Multi-Output)天线和正交频分复用(OFDM,Orthogonal FrequencyDivision Multi-plexing)调制。MIMO技术
信息系统维护(包括移植)是软件生命周期的重要一环,是信息系统不断增强实用性与可靠性的重要措施。本文作者根据用户实际需求,对企业已有的生产准备WEB信息系统进行了维护性
由于数字图书馆具有丰富的信息资源和便捷的操作性,在近几年内其得以快速的普及和发展。当前比较成功的数字图书馆系统有ACM数字图书馆,中国知网(CNKI)等,但是它们面临着用户无法
MPLS(多协议标签交换技术)是目前组建VPN的一种关键技术,它为基于IP的QOS或COS提供了体系结构的支撑。但是,由于MPLS本身没有固有的COS或QOS特性,尤其是MPLS对路由的依赖性远
平面问题是一个典型的组合优化问题。平面问题在印制电路板的设计和大规模集成电路(VLSI)的布线方面有着重要的应用,对于很多可视化问题,例如基因调控网络的可视化也有着重大
自上个世纪50年代以来,随着自然语言处理技术的日趋完善,自动文摘取得了丰硕的成果。到20世纪90年代,随着Internet的开通并在全世界范围内的普及,自动文摘的价值充分显露出来
教务管理是高校管理工作中的一项重要内容。随着计算机网络技术的飞速发展和高等教育体制改革的不断深入,人们对高校教务管理的信息化程度提出了更高的要求。然而,由于各高校管