基于关系数据库中多值依赖的贝叶斯网络学习

被引量 : 0次 | 上传用户:jonasgu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网络的学习问题一直是知识发现领域的重要研究方向,目前主要有两种贝叶斯网络结构学习算法:基于评分搜索的方法,基于依赖分析的方法。然而,贝叶斯网络的学习问题还没有完全被解决,由于在实际应用中,领域变量的数量一般是非常大的,随着变量个数的增加学习复杂度呈指数级别增长,如何有效地降低算法的学习复杂度成为关键问题。为了解决这个问题,有些研究者提出在贝叶斯网络的学习过程中使用专家知识作为指导,如根据专家知识对属性变量进行排序,或者使用专家知识进行属性子集的选择等等,这种方法被证明是十分有效的。在本文中,我们将考虑在关系数据库中存在的各种数据依赖关系,并把它们作为一种有价值的专家知识应用于贝叶斯网络的构造过程中。本文所提出的贝叶斯网络分类模型称为基于函数依赖与局部多值依赖的朴素贝叶斯(FM-NB),它继承了NB具有简单网络结构的优点,且保留了TAN能够表达属性之间的相互依赖关系的优势,从而放松了条件独立性假设。它在对数据集预处理的过程中,使用关联规则技术挖掘出属性之间存在的函数依赖与局部多值依赖关系,然后在分类过程中使用这些数据依赖删除冗余属性及构造初始的网络结构。我们通过分析数据库中的函数依赖关系,根据Armstrong公理给出与之对应的概率推理规则,并且发现在函数依赖右侧的属性对于分类来说是冗余的,从而可以在构造分类器之前挖掘出数据集中蕴含的函数依赖,然后使用它们删去冗余属性,如此可以降低算法的计算复杂度。对于数据库中的多值依赖关系,根据其自身的特点,论证了多值依赖及嵌入多值依赖与条件独立性之间的关系,为把它们运用到贝叶斯网络的学习过程中奠定了基础。由于多值依赖对属性集的限制条件较强,但它蕴含了条件独立性,而嵌入的多值依赖在现实生活中应用比较广泛,为了结合两者的优点,提出局部多值依赖的概念。为了把函数依赖与局部多值依赖运用到贝叶斯网络中,我们讨论了它们在不同情况下分别对应的局部网络结构,在构造贝叶斯网络时首先运用这些局部结构生成初始的网络结构,然后在此基础上构造整个网络,如此不仅保持了属性之间的相互依赖关系,而且简化了网络的构造过程。为了验证FM-NB的分类效果,我们对该模型进行了实现,在对连续属性进行离散化时使用混合的离散化方法,即根据不同属性的取值特点选择适当的离散化方法,从而能够最大程度地保留属性中所蕴含的信息,以保证分类器的性能;如果样本中存在空值,那么直接删掉该样本。对于来自UCI数据库中的9组数据集,在每组数据集上把FM-NB与其它三种分类模型进行了实验对比,分别为:基于向前顺序选择的选择贝叶斯分类器(SNB-SFS),使用经典浮动搜索策略的树增强贝叶斯分类器(TAN-CFS),使用关联规则获得分类规则的分类器(GARC)。实验结果表明,算法FM-NB具有较高的分类精度,且在相同支持度的条件下能挖掘出比GARC更多的规则。
其他文献
从分析雷达辐射源识别的特点出发 ,提出了基于知识库的雷达辐射源识别专家系统。讨论了系统总体结构模型和面向对象模型。根据系统要求建立了数据库 ;积累案例形成案例库 ;获
目的了解孕晚期(35周至分娩前)孕妇抑郁发生情况及对分娩过程的影响。方法采用汉密顿抑郁量表(HAMD)对340例孕晚期孕妇进行抑郁状况调查,记录发生抑郁与未发生抑郁孕妇分娩各
对齐口裂腹鱼Schizothoraxprenanti小规格幼鱼 (体重 ( 1 9±0 2 ) g)、大规格幼鱼 (体重(72 4±7 3) g) 和成鱼 (体重 (371 8±20 5) g) 肌肉中的水分、蛋白质、脂肪含量及
目的统计分析江门市0~6岁各年龄段患儿阴茎长度95%的正常值范围,作为衡量患儿生长发育正常与否的参考指标。方法分别选择0岁、1~2岁、3~6岁小儿各2000例作为研究对象,0岁小儿
近年来,党和政府越来越重视高校家庭经济困难学生的资助工作,也逐步构建起了国家助学贷款、国家层面的奖助学金、校奖学金、勤工助学、学费减免等多种形式并存的高校学生资助
随着能源危机的爆发,节能减排已成为汽车发展的研究方向。液压混合动力技术有功率密度大、蓄能器快充快放能力强等突出优点,适用于中重负载、频繁起停工况,在工程机械、重型车辆
背景:胫骨平台骨折治疗的内固定修复方法有很多种,各有优缺点,有研究报道膝关节内固定修复SchatzkerⅤ、Ⅵ型胫骨平台双髁骨折效果较好,具体此2种骨折修复效果的差异尚不确定
本文基于劳动保障监察信息系统应用现状,结合劳动保障监察业务发展变化趋势,对各级业务的管理者、经办机构、服务对象的应用需求进行了系统化的深入的分析,设计实现了劳动保障监
CANON工艺需要部分短程硝化提供亚硝酸盐,所以CANON工艺存在溶解氧难控制的问题,特别是在反应器较小的情况。本文采用设有挡板的改良SBR,通过机械搅拌形成剧烈水流搅动,精确
随着电子产业的不断发展,人类社会已步入了高速信息化时代,集成电路的发展是信息化发展的一个标志。集成电路技术伴随着计算机多媒体技术、半导体技术、移动通信等技术的创新,其