基于语义的决策树挖掘算法研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:delphiall
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统决策树算法通过计算属性的信息熵来选择属性,信息熵大的属性被优先选取构造决策树。在计算信息熵时,它仅考虑语法层面上字、词的简单匹配,没有考虑数据的语义信息,缺乏对其所包含语义信息的理解,这就导致算法缺乏一定的智能性,致使计算工作量大、复杂性强,而且分类质量不高。特别是在大数据库的应用上,传统的决策树算法更加面临大数据量计算的挑战。本文在分析研究决策树挖掘算法及知网、概念树、语义相似度等相关知识的基础上,针对传统决策树挖掘算法的不足,提出了基于语义的决策树挖掘思想,实现了连续属性语义化和名词型属性语义化的方法,建立了基于语义的决策树挖掘模型。基于语义的决策树挖掘模型较好的利用了训练数据中属性的语义信息,满足用户基于语义的决策树挖掘的需求,实现了一定程度的智能挖掘。实验表明基于语义的决策树挖掘模型能够解决传统决策树挖掘缺乏语义信息的问题、提高数据挖掘系统的知识表示能力,较之传统的决策树挖掘具有更高的效率和预测准确率。
其他文献
随着互联网的普及和电子商务的发展,电子商务系统在为用户提供越来越多便利的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品
人脸容貌的衰老模拟合成技术在刑事侦破、人脸识别、影视化妆辅助设计及数字娱乐等领域都有着重要的应用价值。以往对人脸图像的衰老合成通常只是基于单一人脸的信息;或者按
软件测试是软件生命周期中一个重要环节,直接关系到软件的质量高低,充分的测试是项目成功的重要保障,测试用例的产生是软件测试的关键步骤,因而,软件测试的质量和效率很大程
随着Internet技术和企业信息化建设的迅速发展,J2EE(Java 2Platform,Enterprise Edition)技术作为一种建立企业应用的标准平台出现,并逐步成熟,得以飞速发展。J2EE平台提供了
随着网络技术的成熟,基于网络的计算模式占据了越来越重要的地位。由于瘦客户端系统为实现基于网络的计算模式提供了良好的支持,因而越来越受到人们的重视。   瘦客户端系统
学位
由于对小额贷款公司的监管还很薄弱,个别小贷公司存在违法行为,金融监管部门对管辖范围内对小额贷款公司的管理水平较低。因此,为了实现小额贷款公司业务管理和监管信息化,保
语义Web的发展为实现对Web异构信息的智能访问和处理提供了一个平台。对于传统Web,通过利用可视化的标记语言(如HTML)对资源进行标识,提供了用户可以理解但机器不可理解的知
RBFNN以其简单的结构、快速的训练过程和良好的推广能力等诸多优点已在许多应用领域取得了成功,特别在模式识别和函数逼近方面。在RBF神经网络中,隐单元的位置和相应宽度值的
随着嵌入式系统的快速发展,在一些信息家电中,例如PDA、机顶盒、DVD/VCD播放机等,图形用户界面(GUI)越来越受到人们的重视。MiniGUI(Mini Graphical User Interface)最初是一
随着网络技术的快速发展,互联网已经成为人们生活不可缺少的一部分。虽然随着网络硬件技术的发展网络带宽不断增大,但是网络资源总是有限的,由于网络中资源和流量的分布不均