贝叶斯网络结构学习与应用研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:mm1234567mm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网络(Bayesian Network,BN)是概率论与图论结合的一种图模型,具有强大的知识表示与推理能力,为解决预测、分类及推理等问题提供了坚实的理论基础。BN广泛应用于可靠性与风险分析、医学诊断、生物信息学等领域。基于BN理论解决实际应用问题时,一个关键的任务是依据研究目标的特征建立能够刻画不同属性之间关系的BN拓扑结构,因此BN结构学习逐渐成为BN研究领域的热点和难点问题。本文首先针对一般BN结构学习算法进行研究,然后对特殊的BN(贝叶斯网络分类器,BNC)的结构学习方法进行优化,最后将BNC应用于石油地质领域,解决实际油气资源空间分布问题。论文的主要研究工作如下:(1)由于学习最优BN结构是一个NP难问题,因此一般采用群智能优化方法解决该问题,但是该类方法仍然存在搜索效率及寻优精度低等问题。针对上述问题,本文首次将萤火虫算法引入到BN结构学习中,提出一种新颖的基于离散萤火虫优化算法学习BN结构的方法,记作DFA-B。DFA-B算法具有参数少、收敛速度快和较强的全局搜索能力等优点。在DFA-B中,首先将BN拓扑结构和对应结构的评分分别抽象成萤火虫的位置和发光强度。然后重新定义了在离散状态下萤火虫的飞行策略,并利用进化计算思想为每只萤火虫增加变异算子,增强其探索能力并防止算法陷入局部最优。最后使用局部优化器来提高萤火虫的开发能力,确保找到得分最高的候选解决方案。本文提出的算法在基准网络上与其他主流算法进行对比,实验结果表明DFA-B评分更优且收敛性更好。(2)TAN是当前流行的一种BNC,但是该方法存在两点不足:(1)随机选择根节点造成分类性能波动,(2)属性之间存在冗余边导致分类性能下降。针对上述问题,本文从属性间权重的度量指标和过滤冗余边两方面对TAN结构进行优化,提出了一种新颖的基于互信息贡献率的柔性树增强朴素贝叶斯算法(FTAN)。在FTAN中,首先采用互信息贡献率()描述不同属性之间的不确定性减少的相对量。在建立最大加权扩展树的过程中,使用在细粒度上刻画属性之间的依赖关系,有利于确定属性之间边的方向,从而避免随机选择根节点造成的分类性能波动。然后采用一种柔性过滤方法,通过动态调节阈值过滤掉属性之间具有弱依赖(独立)关系的边。实验结果揭示,在0-1损失函数和类概率均方根误差方面,FTAN算法与其他流行算法对比取了显著优势。(3)准确预测油气资源的空间分布是油气勘探的重要组成部分,对提高勘探效率、优化钻井策略和增加经济效益具有至关重要的意义。现有的解决油气资源空间分布预测问题的方法主要是从判别角度进行建模预测。该类方法不能定量表达不同地质属性之间的潜在关系,并且分类准确度具有较大的提升空间。BNC的结构可以自然的刻画不同地质变量之间的关系,因此本文将BNC应用于石油地质领域,提出基于BNC方法解决油气空间分布预测问题。在工程应用研究过程中,首先定义了油气空间分布预测问题的数学形式表达式。然后从属性排序与模型简化两方面对KDB算法进行优化并提出了SKDB算法。最后运用FTAN和SKDB两种BNC方法解决准噶尔盆地腹部侏罗系三工河组油气空间分布预测问题。实际应用结果表明,BNC方法无论是在准确度上还是在应用效果上都明显优于当前主流方法,同时根据SKDB模型预测结果指出了三工河组剩余油气资源有利分布区域,为下一步勘探决策提供重要参考。
其他文献
随着科技和工业的不断发展,人们在追求更快、更高、更强的目标同时,也面临着更加严苛的应用环境。在金属冶炼、能源勘探、航空航天等领域存在着高温高压、强辐射、强化学腐蚀、强电磁干扰等诸多类型的苛刻环境。如何在这种极端环境下实现参数的准确监测和设备的健康评估是各相关领域亟待解决的重要问题,同时也推动了传感技术的不断发展。在应对上述苛刻环境的传感监测中,光纤传感器以其耐高温、抗电磁干扰、易复用组网等优点,具
甲状腺癌是最常见的内分泌恶性肿瘤,其发病率在世界范围内呈稳步上升趋势。目前对于甲状腺癌的诊断方法主要依赖超声影像指导下的细针穿刺活检(Fine-needle aspiration biopsy,FNAB),但是FNAB作为一种侵入性检查不仅对执行操作的医生有较高的技术要求,还存在创伤较大、易出现穿刺路径转移和有出血风险等缺点。另外有约20%-30%的甲状腺结节存在因缺乏典型的显微镜下病理特征或处于
线粒体是维持心肌细胞功能最为关键的细胞器之一,通过调控细胞代谢、凋亡、氧化应激等维持细胞稳态,在心脏功能障碍等研究领域一直受到广泛关注。Sirt3作为线粒体基质中最为主要的去乙酰化蛋白酶,其调节代谢功能与抗氧化损伤的保护作用紧密相关。目前的研究认为,Sirt3参与了不同的心脏病理生理过程,但是其作用机制并不十分明确。现今已有的实验发现,Sirt3作为线粒体Sirtuins家族的一员通过调控抗氧化酶
图形用户界面(Graphical User Interface,GUI)又称图形用户接口,如今遍布于各类电脑程序、移动应用软件和在线网站,是用户与软件程序之间交互的桥梁。优秀的GUI设计美观精巧且简洁易用,是一款应用程序(Application,App)成功的关键。但GUI设计工作不仅非常耗时,还需要设计者持续保持创造力以适应不断更新的流行元素,即便对经验丰富的设计者来说仍充满挑战。而且由于目前各
研究背景冠状动脉粥样硬化性心脏病是指冠状动脉发生粥样硬化引起管壁狭窄或闭塞,导致心肌缺氧或坏死而引起的心脏病,简称冠心病(coronaty heart disease,CHD)。动脉粥样硬化(Atherosclerosis,AS)是CHD的病理基础。AS是一种与脂质代谢障碍有关的全身性疾病,其病变特点是血液中的脂质进入到动脉壁并沉积于内膜形成粥样斑块,进而引起动脉狭窄性疾病。AS的发病机制主要包括
大麻二酚(CBD)是一种从大麻中提取的大麻素,具有非精神活性和广泛的治疗特性,包括抗惊厥、抗焦虑、抗精神病、抗恶心、抗风湿和关节炎等生物活性,同时具有良好的安全性和耐受性。然而,CBD对环境具有敏感性,如加热、光照和氧气时,可能会发生异构化、聚合或降解,阻碍了CBD在食品和制药行业的广泛应用。此外,口服CBD具有挑战性,由于其在胃肠道中的溶解性较差,在人体内的生物利用度仅约6%。因此,构建递送体系
石油,水和天然气等自然资源的储层多为孔隙介质。弹性波(声波)在孔隙介质中传播诱导电磁场的现象称为“震电效应”。这种现象与孔隙介质中的双电层结构和孔隙流体渗流效应密切相关。随着微弱信号检测和信号处理技术的提升,基于震电效应的勘探方法越来越受到人们的密切关注。震电勘探同时接收声场和电场信号,既反映地层的声学性质又反映其电学性质。震电效应测井同时将声源和接收器放置在井孔当中,在深度探测具有一定优势。本文
背景:香烟烟雾中含有多种公认的致癌物,与非吸烟人群相比,吸烟者罹患肺癌的风险显著增高。肺癌的发病率与吸烟密切相关。在我国大力倡导戒烟的背景下,吸烟或二手烟暴露诱发肺癌的发病率和死亡率仍居高不下,而既往对吸烟相关性肺癌的研究多为流行病学或临床研究,对于其相关的机制研究甚少,因此,本课题将在此方面进行初步的探索。SIRT6是组蛋白去乙酰化酶Ⅲ家族的成员之一,通过组蛋白H3去乙酰化,在细胞增殖、衰老、D
背景:脑卒中是全球最常见的致死原因之一。由于其发病快、并发症多、时间窗窄等原因,截至目前针对缺血性卒中的有效治疗方案仍有限。因此,针对脑卒中过程中脑微环境的调节,以及卒中后神经、组织损伤修复的治疗方案显得尤为重要。小胶质细胞是常驻于中枢神经系统的免疫细胞,可响应中枢神经系统微环境变化而改变其表型,发挥促炎或抗炎作用,影响缺血性卒中的预后。有研究表明,小胶质细胞的过度激活有助于神经退行性过程,这些过
纤维蛋白原在正常止血过程中发挥关键作用,它可转化成纤维蛋白,支持凝血酶的生成和血小板的聚集,从而促进伤口愈合。血浆中纤维蛋白原的循环浓度为200~400mg/dL。纤维蛋白原的合成在转录水平受到控制。循环血浆纤维蛋白原水平随年龄增长、肥胖、吸烟和炎症状态而升高。脑小血管病(cerebral small vessel disease,CSVD)是指各种病因导致颅内微静脉、毛细血管、小动脉发生病理性改