贝叶斯网络结构学习算法研究与应用

来源 :大连理工大学 | 被引量 : 35次 | 上传用户:singdj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网络(Bayesian Network, BN)将概率论和图论有机结合,用一种图形化的方式表示联合概率分布。具有完备的语义和坚实的理论基础,目前已经成为处理不确定性知识表示和推理的一种重要理论模型。贝叶斯网络在机器学习、医疗诊断、金融分析等领域有着广泛的应用。并已经取得了较大的成功。但仅由专家诊断构建贝叶斯网络通常十分困难,有时甚至是不可能的。因此,如何从数据中快速、准确地学习贝叶斯网络结构,并把它应用到实际领域中,具有重要的理论意义和应用价值。本论文在研究国内外算法的基础上,针对贝叶斯网络的相关算法和不完整数据的学习问题进行深入研究,提出改进算法,并将算法应用于轻度认知障碍和脑血管疾病风险因子预测的实际需求中,开展的主要工作如下:1.最近邻KNN(K-Nearest Neighbour)算法被广泛应用于机器学习和数据挖掘领域,本文将贝叶斯网络的结构学习与KNN算法相结合,提出了基于贝叶斯网络结构学习的KNN算法(BS-KNN),把贝叶斯网络结构学习的结果作为改进KNN算法中相似性的评测指标,概率系数越大,其相应的特征越重要,对分类结果的影响越大。实验结果表明,新算法的复杂度与同类算法相当,在数据集中属性特征较多及样本量较大的条件下,算法的准确性和稳定性均有所提高。2.数据不完整的情况经常发生,这将导致贝叶斯网络结构学习算法精度不高的问题,基于此,本文提出基于几何分布和KL散度相结合的贝叶斯网络结构学习算法,能够完成从不完整数据中学习贝叶斯网络的结构特征。该算法首先用几何分布表示结点之间的对应关系,然后用KL散度来度量对应关系的相似程度,进而确定不完整数据的取值,最后进行完整数据的贝叶斯网络结构学习。该方法能够避免标准Gibbs sampling的指数复杂性问题和现有学习方法存在的主要问题。3.轻度认知障碍目前被认为是正常衰老向痴呆转化的中间过程,其相关研究对于老年痴呆症的预防和干预有着非常重要的意义。本论文采用记忆、注意和人口统计学数据,提出不完整数据的贝叶斯网络结构学习新算法:首先利用互信息获得属性特征的重要程度,从而找到与不完整数据最相似的样本集,接着采用牛顿插值来得到不完整数据的取值,最后进行完整数据下,轻度认知障碍的贝叶斯网络结构学习,对该病症进行预测和辅助诊断,发现其主要影响因素及其相互作用关系,从而很大程度上减少患者进行检查的代价,提高诊断的客观性。临床的实验结果表明,本论文的方法获得了较好的效果。4.脑血管疾病具有高发病率、高致残率、高死亡率和高复发率的特征,因此研究脑血管疾病相关风险因子的预测,具有非常重要的意义。本文结合信息增益技术,确定结点次序的启发式搜索,来对现有的贝叶斯网络结构学习算法进行改进,并利用该算法分析和探讨脑血管病危险因素(年龄、性别、高血压病、糖尿病、心脏病和高血脂)之间非线性的概率依赖关系,预测脑血管病的发病风险,从而进一步指导其预防和治疗。实验结果表明,该模型能够客观有效的辅助鉴别脑血管疾病的风险因子。
其他文献
国外已有的相关研究表明,蒙台梭利教育与传统教育对儿童学业成绩的影响差异不大;在感知运动技能方面,蒙台梭利教育更有利于儿童的发展;在人格特征和社会性发展方面,蒙台梭利
<正>蜈蚣又叫百足,具有息风镇痉、攻毒散结、通络止痛的功效。近年市场需求量迅速增加,目前市场销价大条(长12厘米以上)每条1.8~2元,中条(长10~12厘米)0.8~1元,小条(长6.7~10厘米
商业银行资本结构动态优化的重要性在美国次贷危机表现尤为突出。因为自身因素、外部环境及政策变化等带来的巨大经济冲击,商业银行资本结构动态优化调整成本是非常巨大的。
为有效打击各类地下军事目标,发展航空侵彻炸弹具有迫切的军事需求和重要的现实意义,而制导方案设计是航空侵彻炸弹研制的关键部分。本文在设计航空侵彻炸弹弹道的基础上,把
据外媒报道,发生于当地时间11日上午的美国纽约曼哈顿爆炸案的犯罪嫌疑人乌拉,承认他是通过互联网受到“伊斯兰国”极端主义思想的影响,并掌握了简易爆炸装置的制作方法。鉴
报纸
看戏过程中我试想过:这个题材若是交到我们手里,十有八九,会被写成关爱“残障少儿”的故事,其中满是来自社会、家庭的……煽情却苍白的爱心。说“苍白”,是因为所有我们习惯表达的
报纸
<正> 一、对幼儿良好性格培养价值的认识中国和澳大利亚两国的幼教工作者都认为,性格是一个人的各种本质的、稳固的心理特征的综合,它表现出对人、对事物及对自己的态度;幼儿
当前多数电厂的发变组保护在进行整定计算时,容易忽略与励磁调节器的配合,导致一旦励磁系统出现异常,发变组保护即动作于停机。为避免不必要的停机,从三方面分析发变组保护定
2007年,随着《中华人民共和国物权法》的颁布实施,业主撤销权制度在我国得以确立。由于这一制度从确立至今不过三年有余,故有关该制度的很多问题,如业主撤销权的性质、主体、
提出一种建立风电多场景的新方法,用于计算发生概率较大的风电出力场景及该场景下的系统静态电压安全域边界。该方法依据风速的威布尔分布特性,能够在参数未知的情况下,利用