考虑推理效率的贝叶斯网学习方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:hai_john
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网是一种代表性的基于概率的智能信息处理模型,它能够揭示变量间的因果关系,具有一定的可解释性。当前针对包含较少变量的贝叶斯网的结构学习方法的研究已经较为成熟,但将这些方法应用于包含成百上千个变量的大型网络的结构学习时,往往无法在短时间内给出结果。另外,现实世界中的数据集往往不是完备的,部分变量由于各种原因无法取得观测值,利用已经学习出的网络对存在缺失值的变量进行推理也是一项常见的任务,因此在结构学习过程中限制网络的推理复杂度也是至关重要的。围绕大型网络的结构学习和在结构学习过程中限制推理复杂度以提升推理效率的主题,本文主要进行了以下工作:(1)提出了一种结合父集识别和变量序的贝叶斯网结构学习方法。利用父集识别算法得出的变量间的依赖关系作为启发式信息,为存在强依赖关系的变量在无向图中首先确立关系,并将无向图有向化得到的变量拓扑排序序列作为OBS(ordering-based search)算法的输入,后续利用OBS的局部搜索算子继续优化变量序,并学习出与该变量序相一致的贝叶斯网结构。该算法是一种随时停止算法,可以在预先设定的时间内学习出当前评分最高的网络结构。本文在包含不同变量数的贝叶斯网上对该算法进行了实验,实验结果显示新算法相对于传统OBS算法在大部分中大型网络上能够更快地学习出评分更高的结构。另外,本文还进行了对不同最大入度约束下学习出的网络执行推理任务的实验,结果显示入度越大的网络推理精度相对较高,但同时所需的推理时间也更多。(2)提出了一种改进的限树宽贝叶斯网结构学习方法。在结构学习方法的结构优化步骤中,每一次为当前变量选择父变量集时除了考虑父集的评分之外,更新k-tree时考虑选择包含了选定父集且团中变量维度乘积最小的k-clique,有利于后序变量能够选择到维度乘积较小的父集,从而减少推理时独立参数的个数,提升推理效率。本文将新算法学习出的贝叶斯网结构在不同缺失率水平的数据集上执行推理任务,实验结果显示与改进前的算法相比,本文的算法在不降低推理精度的情况下,将推理时间缩短了约10%,一定程度上提升了推理效率。
其他文献
提取实体之间的因果关系是获取因果关系知识的基础,也是自然语言理解(Natural language understanding,NLU)任务的一个基本步骤。因果关系往往伴随着实体的时间线索:一个实体的因果关系总是状态的变化或行为的变化,这些变化伴随着时间的变化。据我们所知,时间因果关系提取没有得到与其重要性相一致的足够重视,对于时间因果关系的研究几乎没有,同时带有时间关系和因果关系的数据集更是少之
学位
近年来,黑色素瘤的患病人数有着逐年上升的趋势。黑色素瘤对人们的健康造成了很大的威胁,对它的及早诊断和治疗非常有利于延长患者的生命。皮肤病变图像分割是对皮肤病变图像分类之前关键的一步,良好的分割结果将有助于提升皮肤疾病的分类正确率,帮助临床医生更好地进行诊断。采用人工方式对采集的皮肤病变图像进行标注等对医生的专业知识和经验有较高要求,而且会消耗医生较多的时间与精力,容易出现人为失误,开发自动对皮肤病
学位
对5G专网网络业务质量主动探测进行研究与实现。采用集中式部署,在测试中心远程控制多个网络接口的自动化测试,基于测试数据记录,进行质量实时监控预警,利用图数据库和二叉决策树对预警事件进行推理分析,对故障点进行定界定位。针对现有网络质量监测现状进行对比分析研究,针对不同的要素进行解决方案适配。通过客户切片模拟方式对5G专网网络进行端到端业务质量主动探测,能够快速实时感知业务质量劣化,有效提升运维效率;
期刊
数字图像在获取过程中,由于采集环境、传感器设备等条件不理想,往往会受到不同程度的噪声污染。这种噪声污染具体表现为像素之间存在明显割裂感或出现吸引视觉注意力的孤立像素点或者像素块。随着信息时代的来临,视觉信息尤其是数字图像信息对人们的生活和工作影响越来越大。噪声的存在严重扰乱人们对图像正常、真实的视觉感受,噪声的污染也进一步影响图像增强、图像识别等后续对图像的深度处理和应用。因此对图像降噪以获取更高
学位
子宫内膜异位症(EMs)是一种常见的妇科疾病,主要表现为子宫内膜组织的异位附着和生长,严重危害10%~15%的育龄妇女,患者常表现为重度疼痛或不孕。由于不完全了解其所涉及的潜在机制,药物治疗有很大程度的局限性。我们对临床上中国女性的一些代谢指标进行调查,发现高水平的载脂蛋白A1/载脂蛋白B(Apo A1/Apo B)和脂蛋白a(Lp(a))与子宫内膜异位的发展密切相关。然后,我们建立了两个子宫内膜
学位
肺部CT图像分割是肺部医学图像处理中的一个基础问题,已有一些研究利用深度神经网络实现肺部CT图像的病变区域分割。肺结节的形状和尺寸多变,目标区域小,为提高肺结节的自动分割的精度,本文开展了深度学习肺结节分割方法研究,提出了一种基于特征压缩激活网络的肺部CT图像分割算法。针对U-Net模型在肺结节分割任务中出现的输出结果精度较低问题和网络复杂度提高带来的退化问题,本文在U-Net的编码和解码路径中添
学位
随着无线通信和移动应用的高速发展,移动智能设备种类越来越多,功能也越来越强大,如物联网、5G、无人机、智能家居、虚拟现实等等。这些新型应用对移动设备的计算能力、续航和能耗等资源都具有了更高的要求,然而移动设备受体积限制,无法满足如此大量的需求,这成为了当前移动设备应用的关键问题。为解决该问题,有专家提出了移动边缘计算技术(MEC),该技术通过在移动设备附近部署服务器,为移动设备提供强大的计算服务,
学位
<正>【假期诗】枯藤老树昏鸦,空调wifi西瓜。葛优同款沙发,夕阳西下,我就往上一趴。【开学诗】课堂上心不在焉,见书本头晕目眩。一听课心思跑远,遇考试愁眉苦脸。犯了暑假综合症的同学,要尽快"治疗",对症下药!让自己重拾往日课堂上的积极上进状态。重新调整生物钟假期里,很多同学晚睡晚起,生物钟已经变成了"假期模式",开学前有必要按学校的作息时间安排饮食起居,调整为上学时期的生活规律。早睡早起,保证睡眠
期刊
报纸
血液胆固醇浓度异常是引发心血管疾病的重要因素,实现血液中胆固醇水平的快速、灵敏检测在临床应用领域需求很大。目前,检测用胆固醇氧化酶主要来源于微生物,其通过结合辅因子FAD催化胆固醇氧化,并伴随过氧化氢的产生。制约胆固醇氧化酶大规模商业化应用的主要问题是其表达纯化过程所导致的高成本和纯化后酶蛋白的储存不稳定性。微生物表面展示技术能够跨过蛋白质的表达纯化步骤,有效降低成本,且细胞表面所提供的承载微环境
学位