论文部分内容阅读
世界及其物质系统具有复杂的网络结构.实验数据是人类认识世界的重要工具.随着人类获取数据的能力增强,海量数据及其中隐含的规律使现代科学研究越来越富于挑战性,
依据系统的结构特征、考虑到复杂网络理论发展和实际应用的需求,本文提出了一种复杂逻辑网络模型.它既能处理海量数据,批量地从数据出发,挖掘数据背后所隐藏的,元素与元素之间尚未发现的相互作用的机理与规律(主要是逻辑关系),又能解决两个(或多个)元素之间是”怎样”的相关的问题。所谓“逆向”就是指从数据出发的建模,而不是传统的机理建模。
传统的复杂网络实际上这种复杂逻辑网络的特例.例如有向网络可以视作一阶逻辑网络,但是在生物中也普遍存在高阶逻辑的现象,例如,蛋白质C在物种中出现当且仅当蛋白质A和B同时出现.2004年Bowers提出生命科学中的这种高阶逻辑现象,并给出发掘这种高阶逻辑的方法-系统发生谱的逻辑分析(LAPP).LAPP方法是从复杂网络的元素(或部件)的表达数据出发,通过逻辑分析,找到元素之间的逻辑关联性的建模方法.这种方法最初用在蛋白质表达谱数据上,利用信息熵的算法发现两种蛋白对一种蛋白的联合作用,对于发现蛋白质之间的新的作用机理有重要意义.脱离生物学的背景,LAPP方法可以批量发现逻辑关系,因此也是一个生成复杂基因逻辑网络的方法.它对网络的调控发展有相当的意义,自Bowers的方法提出以来,这个方法在理论、算法和应用上都有了新的发展,从而导致复杂逻辑网络这一概念的提出。
由此本文所作工作如下:在理论上,首先将逻辑由二值的布尔逻辑推广到三值逻辑,并且给出了三值一阶逻辑的分类和随机三值逻辑网络的一些基本性质,其次给出了复杂逻辑网络社区结构的算法,便于进一步研究复杂逻辑网络的动力学行为。第三,改进原有发掘逻辑关系的U值算法,给出支持度的概念,以此得到更精确的结果,最后,给出了用复杂逻辑网络解决实际问题的一般步骤。
在应用上,本文将复杂逻辑网络应用到癌症数据(结肠癌、脑瘤等等)和拟南芥数据上.复杂逻辑网络用到癌症上是为了进一步揭示致病机理。通过比较正常组织和病变组织的逻辑网络及其它们的动力学行为,发现正常、腺瘤(未恶化)和癌变三种情况下,基因逻辑网络的动力学行为明显不同,根据目前结果,网络在正常情况下有明显的全局吸引子,在病变情况下,全局吸引子渐渐失去。这也许是癌症的致病机理的一种揭示.通过比较同一癌症不同类型的逻辑网络,可以得到不同病变情况下基因相互作用的具体结构,从结果来看,在不同的脑瘤类型下,同一批基因相互作用的逻辑结构有明显差异.综合关键基因的表达量和基因之间的逻辑结构差异对肿瘤进行分型比单一检测某几个基因的表达量要更加可靠,基因之间的逻辑结构的发现对癌症的的诊断和治疗有相当的意义.在拟南芥的应用上,比较了在不同刺激下,拟南芥不同部位的反应机制,给出未知蛋白的功能的推断方法和相同基因在不同的部位有不同的相互逻辑关系,所有结果都指出,在生物系统中,结构决定功能.复杂逻辑网络更全面、更精确地表达了复杂系统的结构,它有广泛的应用范围和研究空间。