基于生物网络的关联模式挖掘方法研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:hanqianggege
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式识别是人工智能学科中一个重要的研究领域,运用数据挖掘方法解决研究对象的模式识别问题,称为模式挖掘。中医在冠心病诊断和治疗方面有着完善的理论基础和成熟的方法体系,然而中医的基本概念、理论和方法是建立在中国古代阴阳八卦哲学基础上的,对证候模式的描述难以理解和量化,其知识是以非结构化的形式存在的,不利于运用现代医学方法解决问题。本文以证候、表型、基因等实体所构成的生物网络为基础,着重研究中西医在冠心病诊疗中相关概念的关联关系,构建了证候-表型、证候-基因关联模式,对其关系提取和计算方法进行了深入研究,取得了一定的成果。本文主要工作分为两部分:   一.基于特征选择的模式挖掘   ·特征选择构建冠心病证候.表型模式构建:在疾病证候-表型模式构建中,各表型(特征)互相依赖、互相影响,常见的特征选择方法已不再适用,本文提出了基于改进的Markov blanket算法来分析中医证候与表型的关联关系,确定与证候相关的表型集合,构建证候-表型关联模式。   ·分类算法构建证候问诊模型:在确定了证候-表型模式后,以冠心病作为实例,分别使用神经网络、支持向量机、决策树和贝叶斯网络构建证候分类器,对给定的病例数据判定其证候诊断结果,从而实现证候问诊模型。   二.基于文本挖掘和推理网络的模式挖掘   ·利用于文本挖掘构建表型-基因模式:充分利用OMIM数据库精心维护、更新及时、可靠性较高等特点,采用文本挖掘的方法提取隐含其中的表型-基因关联关系,并将这些关系作为构建表型-基因关联模式的基础。   ·利用标签传播算法挖掘潜在关联模式:OMIM数据库所收录的表型和基因数量有限,对于没有包含在其中的表型与基因间的关系,本文利用基因间隐含在蛋白质反应网络中的拓扑结构信息,采用网络标签传播算法挖掘潜在表型-基因关联模式,提出了相应的算法并给出了预测结果。
其他文献
随着科研进程的加速,科学家对信息的依赖也比以往任何时候突出。因此,科研信息日益成为具有战略意义的资源,能否有效利用科研信息将成为科研信息化推进的关键因素。与此同时,随着
目前,随着GIS技术的日益发展,GIS数据的数据量也随之增大。图像数据处理应用的主要问题不再是数据源的不足,而是如何快速、准确地从中提取更加丰富和有用的信息。本选题的研究目
在EAST(Experimental Advanced Superconducting Tokamak)托卡马克实验装置中,数据通讯的实时性衡量着等离子体控制系统PCS(Plasma Control System)的控制性能,该系统的实时通
随着全球信息科技及互联网技术的发展,教育领域与互联网信息技术结合的紧密程度越来越大,特别是2012年兴起的MOOC(Massive Open Online Course),更是带动了全球在线网络教育平台
人体运动跟踪技术是人机交互、虚拟现实领域的重要研究内容之一。随着微机电系统(MEMS:MicroElectroMechanicalSystem)传感器技术的发展,价格低、体积小、重量轻、精度高的新
随着网络规模的快速增长,以视频会议、视频点播、e-Science海量数据传输等Qos敏感的实时业务和多媒体应用为代表的网络应用不断增加,而庞大的网络结构也日趋复杂和多样,如何通过
曙光6000龙芯分区采用HPP体系结构,具有节点内异构多处理器、处理单元间耦合度适中以及非对称设备共享的体系结构特性。高性能计算机研究中心系统软件组针对上述特性设计并实
伴随着集成电路制作技术按照摩尔定律发展,现代现场可编程门阵列(FPGA)正在变得越来越复杂,传统的寄存器传输级(RTL)设计技术越来越不适应大容量FPGA开发的需要。由于基于Sys
网络容灾与网络可生存性是网络安全的基本问题,也是下一代网络不可回避的关键问题。网络上最重要最宝贵的资源是数据和信息,其次才是硬件设备及其驱动软件。因此网络上承载的数
随着控制、计算机、通信和网络技术的不断发展,开放式体系结构、网络化、高可靠性、复合化、多轴联动化成为数控系统的发展趋势。Ether CAT以其开放性好、拓扑结构灵活、可靠