基于对数似然分析的贝叶斯网络结构扩展研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:laiyongxuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何建立一个能够用结构来表示隐藏在领域知识内的分类模型是人工智能领域内的一个关键问题。贝叶斯网络(Bayesian networks,BNs)为不确定性背景下的推理提供了一种紧凑直观的图形表示,并已成为许多概率专家系统的基础。然而,学习一个拥有最优的网络拓扑结构的贝叶斯网络已经被证明是NP-hard问题。自从朴素贝叶斯(Naive Bayes,NB)在良好的分类表现和最小时间开销两方面取得优良平衡的巨大成功后,限制性贝叶斯网络分类器(Bayesian network classifiers,BNCs)就受到了许多研究者的关注,并且研究者们提出了很多方法来改进NB。在改进NB的众多方法中,平均一阶依赖估计器(Averaged one-dependence estimators,AODE)取得了优越的分类表现,尽管对应于AODE中的每一个超父属性一阶依赖估计器(Superparent one-dependence estimator,SPODE)的独立性假设在实际情况中很少成立。模型选择和模型加权都已经被认为是用于放松AODE的独立性假设和提高其分类性能的有效且高效的解决办法。与模型选择和模型加权相比,对于改进AODE模型来说,结构扩展更能为逼近隐含在训练数据中的真实概率分布提供一种可靠的方式。在贝叶斯网络分类器的结构学习中,结构扩展通常被用来探索条件依赖而忽略了依赖的方向关系,这会对贝叶斯网络分类器在不确定性下的推理表达能力产生负面影响。目前随着数据规模的不断增长,具有高表达能力和低偏差的鲁棒性AODE模型也是十分急需的。本文引进了对数似然函数用于度量编码在网络拓扑结构中用于描述训练数据的比特数。同时,由于条件对数似然函数具有非对称性,因此其可以衡量属性和其父变量集合之间的方向关系。从对数似然函数角度出发,本文通过识别属性之间的有向依赖关系来向AODE中的超父节点一阶依赖估计器的拓扑结构中增加增广边。本文提出了一种启发式搜索策略用于最大化对数似然函数并且通过探索属性之间更高阶的条件依赖关系来放松AODE模型的独立性假设。本文提出了一种名为平均树增广的一阶依赖估计器(Averaged tree-augmented one-dependence estimators,ATODE)的贝叶斯网络分类器,其结合了生成式学习的高表达能力和判别式学习的低偏差优势。因此,ATODE继承了AODE模型的有效性而且还在建模高阶依赖时获得了更大的灵活性。为了评估ATODE模型的有效性,0-1损失、偏差-方差分解、均方根误差以及它们对应的Friedman检验和Nemenyi检验被用来进行实验比较分析。在36个UCI数据集(属性个数从5到64,实例个数从57到164860)上的实验结果表明,与一系列单模型贝叶斯网络分类器(例如CFWNB和SKDB)和集成型贝叶斯网络分类器(例如TAODE和IWAODE)相比,ATODE可以取得相当的或者更好的分类性能。
其他文献
随着卫星观测技术的提升,遥感图像在数量、类型等方面呈现出大幅度的增长。这促进了遥感图像分析处理等相关技术的蓬勃发展,同时也带来了更具挑战性的问题:由于遥感图像普遍具有种类多、数量大、像素高的特征,所以遥感图像检索需要消耗更长的检索时间和更大的内存空间。高消耗的缺点驱使越来越多的研究者开始在大规模遥感图像检索上使用哈希技术。哈希技术使用较短的二进制哈希码,利用汉明距离进行检索,所以能够大大加快检索速
学位
耕地资源是人类赖以生存的基础,是我国基本生产资料,对国民经济和社会发展起着双重促进作用。土地具有地域性、可塑性的特征,因此在经济社会发展过程中,我们可以对耕种土地进行合理开发和利用,从而更好地提高我国耕地资源的利用率。但是近年来耕地资源面临着严峻的形势,农民耕地保护意识薄弱,结构调整不够规范,标准后续耕地资源严重匮乏,后续耕地保护监管不力等问题严重影响着耕地保护工作。为此,本文从耕地保护体系、经济
期刊
煤矸石是产生于煤炭采选过程中的一种化学成分较为复杂的黑灰色岩石,被视为工业废弃物。随着煤炭产量的增多,作为煤炭伴生物的煤矸石产量也随之成倍增长。然而煤矸石对生态环境和人类身体健康都存在不利影响,将其用作混凝土粗骨料制成建筑材料,在实现提高煤矸石的利用效率的同时促进煤矸石构件的发展。本文通过ABAQUS有限元模拟的方法,对煤矸石混凝土中高剪力墙的抗震性能进行研究,主要研究工作和结果如下:1.对剪跨比
学位
网壳结构作为大跨度空间结构的主要形式之一,因其具有外形美观、施工方便、受力合理等优点,被广泛的应用于城市的建设当中,人们也逐渐开始考虑网壳结构在冲击、爆炸等偶然荷载下的性能。尽管冲击荷载属于偶然荷载,但随着国际形势的变化和自然灾害的影响,其发生的概率不断增加。一旦结构因冲击产生破坏倒塌,将会造成严重的后果,因此有必要对网壳结构在冲击荷载下的失效破坏进行研究。在现实情况下冲击荷载都带有一定的角度,冲
学位
随着信息化社会的高速发展,传统的身份认证方式诸如密码等早已不能满足人们的实际需要。对于身份识别和认证,更准确、更安全的生物特征识别技术使用率越来越高。近年来,新型冠状病毒因其很高的感染性席卷世界,生物特征识别技术也出现了新的挑战。虹膜识别技术由于具有高安全性和高准确性,引起了科研学者们和制造业企业的重视。虹膜识别产业链也逐步应用到了各种安全应用领域中,成为能够被大众接受的身份鉴别方式。虹膜识别流程
学位
针对目前无人机载激光燃气巡检系统在农村燃气管道中应用存在的问题,文章从实践角度出发,分析了农村燃气管道无人机载激光燃气巡检系统的应用现状,并提出了优化控制策略。结果表明,需在明确系统技术应用优势与原理情况,来达到燃气管道运行安全控制目标。
会议
煤矸石的大量堆积对环境造成了严重污染和土地的严重浪费。利用煤矸石替代混凝土粗骨料不仅可以解决环境污染和土地浪费问题,同时能够缓解建筑行业中砂石骨料供不应求的现状。但煤矸石混凝土存在着承载力较低、延性较差等力学性能上的不足。因此本文提出将耐腐蚀性强,延展性能好的GFRP材料制备成管,并作为模板在其中浇筑煤矸石混凝土,形成GFRP约束煤矸石骨料混凝土这一新的组合结构形式。为更好地了解GFRP约束煤矸石
学位
目的 调查社区老年人失能现状和风险因素,并构建风险预测模型。方法 采用一般资料调查表、卡茨量表、老年抑郁量表和社会支持评定量表对青岛市580名社区老年人入户访谈式调查,分析老年人失能风险因素,建立风险预测模型,采用ROC曲线下面积评价所构建的风险模型。结果 580名社区老年人中,失能老人67人,失能率为11.55%。多因素分析结果显示,高龄、经济来源为政府最低生活保障、子女补贴、缺乏兴趣爱好、不锻
期刊
利用固体废弃物作为原材料的新型混凝土,具有固废资源再利用、节能减排等诸多优势。目前对于以地聚物(Geopolymer)为胶凝材料的混凝土和以煤矸石为集料的混凝土相关研究已经颇为成熟,但以地聚物为胶凝材料,以煤矸石为集料的混凝土相关研究还不多见,特别是在其宏观力学性能与微观层面界面过渡区(Interfacial Transition Zone,简称ITZ)方面的研究较为薄弱。本文以水胶比(0.35、
学位
<正>研究目的:在"双减"政策落地成功后,众多学校推出了"5+2"的课后延时课程服务。在"双减政策"的大背景下,"校园足球"迎来了了发展的新契机,对"校园足球"新路径的探索与思考也显得尤为重要。正确的理论能够更好地指导实践。通过剖析"双减"政策背景,针对校园足球的现状,深化校园足球发展道路,对其发展路径进行重新的审视、探索与思考。
会议