基于Notears算法的贝叶斯网络结构学习及其应用

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:reato
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,贝叶斯网络在遗传学,机器学习和因果推理方面有广泛应用。贝叶斯网络是利用节点间的边来描述变量间的依赖关系,用条件概率描述依赖关系的强弱程度。贝叶斯网络的结构学习即就是学习有向无圈图(Directed Acyclic Graph,DAG)的结构,我们可以将DAG结构与概率论知识融合起来,根据变量的观测数据判断贝叶斯网络中节点之间的依赖关系。但随着节点数目的不断增大,DAG结构学习也成了贝叶斯网络学习的难点,传统的结构学习算法在学习的准确性和学习效率上的不足也越发凸现起来。本文主要研究的是DAG的结构学习,首先阐述了国内外DAG结构的研究现状,介绍了DAG结构学习的三类算法:评分搜索法、基于约束法、混合搜索法,对这三类算法的学习框架做了简单介绍,其次介绍了混合搜索算法中一个新算法——Notears算法,它是由Xun Zheng,Bryon Aragam,Predeep Ravikumar,Eric P.Xing于2018年提出,这种方法主要思想是将DAG结构学习的组合约束问题转化为纯连续优化问题。本文的主要工作如下:(1)本文对Notaers算法中的模型作了改进。本文首先尝试将Notears算法模型中的L1惩罚换为L2惩罚,随后在不同样本量下随机产生稀疏DAG,分别用这两种算法模型对DAG的结构进行恢复,通过模拟发现Notears-L2在小样本量下更能准确的恢复DAG结构。(2)本文将改进后的Notears-L2算法应用到黑龙江省城镇职工基本养老保险基金收入影响因素研究方面,这是DAG结构学习应用方面的一个新尝试。本文利用Notears-L2算法学习得到与基金收入有关的DAG结构,通过分析发现黑龙江省城镇职工基本养老保险基金收入主要受到人口自然增长率、城镇人口占比、城镇养老保险参保人数、老年人口抚养比、社会保障支出、职工平均工资、一般预算收入等因素的影响。随后本文对这些因素进行了进一步探究,可以看出黑龙江省养老保险问题已经刻不容缓。
其他文献
共位群内捕食系统同时包含捕食与竞争两种相互作用关系.对于捕食关系,人们一直关注物种间的直接相互作用而忽略了恐惧效应这一间接作用.但是很多研究表明,恐惧效应普遍存在,并且能够影响种群的繁殖率和捕食活动.本文基于Holling时间预算方法建立一类包含恐惧效应的共位群内捕食模型.理论上,运用定性分析的方法,给出了平衡点的存在性和稳定性条件,并分析了Hopf分支的存在性.数值上,利用Matlab软件展现了
学位
医院作为一个以提供技术性服务为主体的行业,除了要有过硬的医疗技术能力外,提供优质的服务也是提升医院综合能力的必要条件。树立"以病人为中心"的服务理念,能够有效地提高医院的服务水平,是工作中的重点。文章通过满意度调查活动,查找存在的问题,分析原因并提出改进措施,为病人提供高质量的服务,在激烈的市场竞争中创建和谐社区环境,促进医院健康发展。
期刊
该论文主要研究如下一类二阶变系数微分方程(σ(t)u’(t))’=f(t,u(t))的周期解、有界解与无界解,其中f∈K(R×R;R)为Carathéodory函数,关于t是ω周期的,σ(t)∈AC1([,ω])是正的ω周期函数.首先,通过上下解方法,应用Socrza-Dragoni引理证明了周期解的存在性.然后,利用函数的次线性性质和比较定理得到了最大周期解的存在性.最后,在此基础上,给出了有界
学位
基于结核病传播的两种致病机制:直接发展为结核病(快速)和内源性再激活(缓慢),本文研究了如下的在非局部扩散下具有快慢进展的结核病模型(?)行波解的存在性.在空间扩散的基础上,进一步引入了非局部卷积算子来刻画空间中大范围的结核病扩散现象,得到了系统R0>1且c>c*时在全空间上行波解的存在性,即此时,结核病会成为一种地方病.首先通过基本计算得到系统的无病平衡点和地方病平衡点,分析线性化系统特征矩阵的
学位
教师信念对课程改革起着推动作用,随着课程改革的不断深入开展,教师信念研究成为教师教育研究中的一个重要研究领域。对待错误的信念研究也是信念研究的主要内容之一,然而目前国内外关于教师对待错误的信念研究较少。本研究旨在调查国内中小学数学教师对待错误的信念的状况,为我国中小学数学教师对待错误的信念的培养提供策略。本研究结合国内中小学数学教师的教学环境,改编了国外学者Rybowiak(1999)开发的测量对
学位
本论文研究二维周期区域T2上的无量纲旋转浅水方程组当Rossby数和Froude数以不同的速率趋近零时的三尺度奇异极限.首先通过能量估计得到旋转浅水方程组光滑解的一致估计;然后在此基础上利用紧性方法严格证明了初始值为“好始值”情形的旋转浅水方程组的三尺度奇异极限,并得到其收敛速率;最后使用谱分析等方法严格证明了一般始值情形的三尺度奇异极限.
学位
如今随着时代的变迁和科技的发展,利用计算机将传统的测验方式提升到智能化的新高度已渐渐成为了一个趋势。其中,基于计算机自适应测验(Computerized Adaptive Testing)而衍生的多维计算机自适应测验(Multidimensional Computerized Adaptive Testing)受到了广泛的关注,在教育和心理测量等领域愈加发挥着重要的作用。在整个多维计算机自适应测验
学位
Logistic回归模型是在医药业、金融业、制造业等行业中应用十分广泛的一种广义线性回归模型,响应变量Y的取值范围为{0,1},常作为分类器进行预测与判别分析。本文首先对Logistic回归的理论模型进行了介绍。在构建Logistic回归模型时,当预测变量的维数较大时,常需要进行变量选择来得到精确度较高与较稀疏的模型。逐步回归法、向前选择法、向后剔除法、Lasso方法和Elastic net方法是
学位
随着高校通识教育的不断发展,通识教育对学生发展的重要作用越来越得到重视,并且得到国内外教育研究者的关注。怎样正确认识和改进高等教育通识数学教材成为了数学教育界一个亟待解决的问题,本研究旨在通过高校文科通识数学教材的比较,进一步认识目前高校文科通识数学教材的现状。本研究通过选取高校现行的通识数学教材《大学文科数学》和《人文数学》为研究对象,从整体和极限部分对两本大学文科通识数学教材进行比较研究,研究
学位
近年来,全球海洋中的海月水母数量均呈现显著上升趋势.海月水母的频繁暴发,对工业、渔业、旅游业等都造成了严重的损害和威胁.目前,海月水母暴发的机理尚未明确,缺少有效控制其暴发的策略.基于海月水母世代交叠的复杂生活史特点,本文利用动力学建模方法,建立了水母体–水螅体–碟状体的海月水母生活史模型(MPE模型),揭示海水表面温度、海水盐度对海月水母生长的影响,探究环境因子与水母暴发现象的联系.通过Lyap
学位