基于决策树算法的信息系统数据挖掘研究

来源 :信息技术 | 被引量 : 0次 | 上传用户:wjief
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高数据挖掘准确性和效率,文中提出了基于决策树算法的信息系统数据挖掘方法.以C4.5决策树算法计算属性的信息增益率和属性值的信息熵为基础,提出基于余弦相似度改进的C4.5决策树算法,若任意两个属性值的信息熵之差在阈值范围内,通过计算其余弦相似度合并在阈值范围内的属性值,并重新计算合并后属性的信息增益率,实现信息系统数据挖掘.实验结果显示:所提方法对不同数据集的分类精度均高于95%,数据挖掘效率高.
其他文献
城市化建设的进程越来越快,加上我国经济结构的转变和调整建筑工程产业在未来的发展过程中又面临了全新的转型问题,要想更加符合社会的发展趋势,建筑工程产业就必须针对工程施工管理工作采取一系列的创新和升级举措,从而推进我国建筑工程产业的整体迈进和发展.本文,清晰的阐述建筑工程施工管理中精细化管理的概念、含义以及重要性,并且深入的表明了当下建筑工程施工管理中存在的问题,并针对这些问题提升有效的精细化管理优化策略.
当前的云平台数据存储方案忽略了数据的重复性,易产生大量冗余数据,为优化数据存储性能,基于PaaS云平台设计数据存储方案并实现应用.分区删减云平台冗余数据,计算各分区剩余数据权重因子,基于权重因子设计PaaS云平台数据存储顺序,动态生成数据存储方案,将Proxmox VE的虚拟环境模拟系统作为虚拟节点,通过底层服务器实现对资源的统一调配与应用.实验表明:该方案的平均存储耗时分别优于其他三种方案1.225s、0.066s、0.001s,且数据占用空间较小.