小数据集上贝叶斯网络学习研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:jankhxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯网(Bayesian Networks,BN)是用来表示不确定变量集合联合分布的图形模式,有清晰直观、较为符合人们思维方式的特点。目前,贝叶斯网已经成为AI领域的研究热点。当使用贝叶斯网作为某一不确定性知识的描述时,首先面临的问题即是针对该不确定性知识的贝叶斯网络。对于贝叶斯网络学习的研究要集中在从完备数据集和不完备数据集上贝叶斯网络的学习,其默认的前提是在大数据集之上。面对实际应用中由于成本或现场的限制而只能获得小数据集(小样本)的情况,贝叶斯网络的学习具有一定的难度和挑战性。 本文的主要结果和贡献如下: (1)本文分析了贝叶斯网络的构建方法,指出了小数据集上贝叶斯网络的特点和难点。 (2)本文在扩展和借鉴一些经典方法的基础上提出了基于Bootstrap抽样的网络结构学习的遗传算法,实验结果表明该方法在小数据集上学习贝叶斯网络具有一定的有效性。 (3)针对第一种学习方法搜索效率比较低、计算开销比较大的缺点,将数据集修正与结构化一期望优化(Structural EM)算法相结合,得到一种更有效的小样本上贝叶斯网络学习的新方法,然后分析比较了这两种方法的适用范围和特性。 本文的研究成果为小数据集上贝叶斯网络学习的研究提供了可行的思路和方法,对于贝叶斯网的实际应用和实现技术有较大意义。
其他文献
已有模型资源的有效重用是计算机图形领域面临的重要课题之一。本文以常见的室内景物作为研究对象,利用体感设备针对景物采集所得的RGBD数据的分割结果在三维模型库中检索相
随着计算机技术的飞速发展和广泛应用,海量信息的开放与共享日益增强,信息安全性日益成为突出问题。数据库系统作为信息存储的主要场所,保证和加强其安全性是迫切需要解决的研究
随着社会的进步和发展,人们不断涉及到很多复杂的实际应用问题。他们对计算机的计算速度和智能性提出了挑战。演化算法是用计算机模拟大自然的演化过程,特别是生物进化过程,来求
串匹配是计算机研究领域的一个经典问题,是许多网络安全系统的关键技术之一.随着信息量的急遽膨胀,应用系统要求更准确、更快速的对海量信息进行分析过滤,采用简单关键词来描
静校正在地震资料处理中十分重要。经野外一次静校正后,残余的静校正量可用剩余静校正方法求出。剩余静校正问题实质上是一个非线性优化问题。遗传算法是一种重要的非线性全
本文所研发的“基于GIS的多目标地球化学信息管理与综合评价系统”以国土资源部与上海合作开展的“多参数立体城市地质调查项目”为背景。 上海社会经济近十余年来发展速
随着WWW的迅速发展,Web信息检索技术成为研究者广泛关注的话题,但缺少合适的测试评测机制制约了中文网页信息检索技术的发展。参考国外测试集的构建经验,我们构建了大规模中文网
手绘草图既符合人们“笔录纸现”的思维表达习惯,又能充分利用计算机极强的信息维护功能,因此在人机交互领域具有强大的生命力。小型化、便携式和无线设备的快速发展极大地推动
随着互联网的发展,信息检索技术广泛地用于搜索任务。相比于传统的Unigram概率模型,Bigram相关性建模是提高检索精度的重要技术手段,但由于相关计算复杂性过高,难以应用于大规模
数据仓库作为支持决策制定过程的重要手段,近几年来得到了迅速发展,并已经成功应用到制造业、零售业、金融服务、电信、运输等多个行业。随着数据仓库的深入应用,数据质量问题成