【摘 要】
:
随着数据库技术的成熟应用和Internet 的迅速发展,人类积累的数据量正在以指数速度增长。对于这些数据,人们已经不满足于传统的查询、统计分析手段,而需要发现更深层次的规律
论文部分内容阅读
随着数据库技术的成熟应用和Internet 的迅速发展,人类积累的数据量正在以指数速度增长。对于这些数据,人们已经不满足于传统的查询、统计分析手段,而需要发现更深层次的规律,对决策或科研工作提供更有效的决策支持。正是为了满足这种要求,从大量数据中提取出隐藏在其中的有用信息,将机器学习应用于大型数据库的数据挖掘(Data Mining)技术得到了长足的发展。所谓数据挖掘(Data Mining, DM),也可以称为数据库中的知识发现(Knowledge Discover Database, KDD),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。发现的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。因此,数据挖掘是数据库研究中的一个很有应用价值的新领域,它又是一门广义的交叉学科,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。基于贝叶斯技术的分类是当前数据挖掘领域的一个研究热点。本文主要研究了以下几个主要内容: 1.综述了数据挖掘及分类的基本理论,介绍了数据挖掘及分类的一些基本概念,讨论了几种主要的分类算法:决策树、神经网络及贝叶斯,并对它们进行了分析比较。2.讨论了贝叶斯分类的主要内容,包括贝叶斯定理以及朴素贝叶斯分类和贝叶斯网络分类。3.研究了贝叶斯网络的学习问题,包括贝叶斯网络结构学习和贝叶斯网络参数学习。4.介绍了我们开发的SDM 数据挖掘系统的系统框架以及功能实现。并重点介绍了贝叶斯算法模块。
其他文献
对复合金属氧化物催化尿素醇解合成碳酸二乙酯反应进行了研究,优选出Zn-Mg-Al三元金属氧化物催化剂对其进行了BET和XRD表征分析,并对合成碳酸二乙酯的工艺参数进行了优化。研
自1985年Fauconnier提出心理空间理论以来,经过10多年发展到今天的概念整合理论,已基本成熟,目前成为认知语言学的重要组成部分,它和Lakoff的概念隐喻理论为研究语言运用背后的认
以粒化高炉矿渣为主要材料,熟料与脱硫石膏作为复合激发剂,添加少量外加剂,制备了新型高效金属矿用胶结材料,探讨了胶结材料的胶结原理以及不同掺量原料对充填体强度的影响规
注氮气提高原油采收率在塔河油田取得了较好的效果,但随着注氮气规模的扩大,天然气中氮气含量也不断上升,天然气热值不断下降,对用户生产经营造成了影响。本文针对高含氮天然
针对公路桥下采煤属重要建(构)筑物下采煤的实际情况,为充分开采优质煤炭资源,延长矿井服务年限,范各庄矿在原公路桥下2180五个工作面全部成功开采的基础上,对沙河新公路桥下的
鸡传染性法氏囊炎病(Infectious Bursal Disease,IBD)是由鸡传染性法氏囊炎病毒(Infectious Bursal Disease Virus,IBDV)引起的以危害雏鸡为主的急性接触性传染病,给世界各国的养
甲醇催化转化制烃是非石油路线制备液体燃料和化学品的一条重要途径。自从上世纪70年代发现分子筛是有效的催化剂以来,甲醇定向转化制烃取得了重要进展,甲醇选择性制汽油和烯
化工装置运行中因出现高温、高压、有毒、易燃介质泄漏而存在安全及环保方面的隐患,需采用带压堵漏技术予以解决。重点介绍了带压密封堵漏技术的原理以及其在化工装置中的应
目的: 致伤工具可以揭露、证实犯罪,刻画犯罪条件,提供侦破线索,因此推断和判定致伤工具一直是法医病理学研究的一项重要内容,推断致伤工具目前的研究主要集中在对创口的微观
<正>聚碳酸酯(PC)具有良好光学性能、机械性能、电绝缘性能,广泛应用于汽车零部件制造、消费电子、家用电器、建筑板材和医疗器械等众多领域,是五大通用工程塑料中用量最大、