基于粗糙集合和朴素贝叶斯模型的分类问题研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:leaffan1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
KDD是在数据库和人工智能的相互融合渗透中逐渐发展起来的一个有着广阔应用前景的新兴研究领域,是从数据中提取人们感兴趣的、潜在的、可用的知识,并表示成用户可理解的形式。分类是KDD领域中重要的研究分支。由波兰数学家Pawlak提出的料糙集合理论是一种表示和处理不确定性知识的方法,在KDD领域中具有越来越重要的地位。朴素贝叶斯分类技术是以贝叶斯定理、最大后验假设等理论为基础,其分类模型由于简单、易于实现而受到普遍青睐。本文对基于粗糙集合和朴素贝叶斯的分类问题进行了研究,主要包括以下几个方面的内容:研究了不完备信息系统中粗糙集合理论的扩展,提出了一种基于属性重要度的粗集扩展模型。将粗糙集合理论引入朴素贝叶斯分类模型的研究中,提出了基于信息熵的近似属性约简算法(MAIR),改善条件属性间的依赖关系,最大程度上满足朴素贝叶斯分类条件独立性假设的要求。在MAIR算法的基础上提出了基于粗糙集合理论的朴素贝叶斯分类算法(RSBC),实验证明,该算法在分类正确率上优于朴素贝叶斯分类算法。
其他文献
第三代P2P系统大多数都提供了一种DHT算法,它将网络中的资源随机地分布在参与网络的各个节点上。在某种情况下,某些节点分配到的资源是平均水平的O(10gN)倍。而且,在标识符空间
“基于XML远程教育资源描述与管理系统的研究与实现”论文是结合科技部十五重大科技攻关项目:“网络教育关键技术及示范工程”的“非实时教学系统”课题进行的。论文旨在研究
网络可靠性评估是无线传感器网络(Wireless Sensor Networks, WSN)设计和优化的核心步骤,但现有的WSN可靠度求解模型没有考虑WSN在通信时延、不完全覆盖(ImPerfect Coverage,
随着计算机技术与信息技术的快速发展,非线性动力学方法在生物医学信号分析领域的应用越来越广泛。然而,准确的分析、鉴别脑电信号并非易事,通常需要专家们记录连续几天的脑
介质损耗因数是反映电力电容器、电容型套管、电容型电流互感器、电容式电压互感器等电力网络中高电压电气设备绝缘性能的一项重要指标,通过测量介质损耗角可以监测出绝缘介质
随着Internet/Intranet的快速发展,部门之间需要协同合作,如何共享这些异构数据源的数据成为很至关重要的问题。同时异构数据库的存在给实现不同信息系统间数据的访问操作带
现代故障诊断系统是一个动态的、分布的、柔性的和不确定的复杂系统。多Agent能够利用并行分布式处理技术和模块化设计思想,把复杂系统划分成相对独立的Agent子系统,通过Agen
随着软件产业的发展,遗产软件日益增多,软件再工程已经成为一个重要的研究领域。系统理解是软件再工程的基础,可以弄清一个程序“做什么”以及“如何做”,目前存在着许多正在使用
近年来信息技术迅猛发展,很多的信息管理领域得到发展并不断壮大。电子商务、电子政务、办公自动化和企业信息系统的应用成为了当今管理信息系统应用的热点。在这些领域中,业
随着Web技术的发展,Internet已经发展成为一个巨大的全球化信息空间。在这种情况下,用户面对浩瀚的信息海洋,往往无法准确找到自己所需要的信息。传统搜索引擎的出现在一定程度