一种改进的分类算法及其应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:dd398622409xiewenjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,高校教师资源管理缺乏技术理论支撑,导致师资管理不当,师资流失严重,急需能够正确分析教师类型与流失原因的分类系统,从而能够为相关管理人员提供及时地、有针对性地决策依据。 分类技术中常见的是决策树方法,常见的有ID3,C4.5,SLIQ,Sprint,Public等,其关键问题在于测试属性的选择。为了找出真正影响决策的属性,减小决策树的规模,引入了基于属性相似度的分类算法,该算法是根据相似性原理,以测试属性和决策属性的相似度作为启发规则构建决策树的分类算法,其选择测试属性的计算速度比ID3算法更快。然而,基于属性相似度的分类算法在属性的选择上倾向于选择取值较少的属性,结果通常会增加树的深度;在构建决策树过程中,此算法不需要重新计算相似度,容易降低分类的精确度。 针对基于属性相似度的分类算法存在的问题,在使用属性相似度作为属性选择依据的基础上,对其相似度的计算方法做了修改。改进思路是:判断每个属性的取值分布,如果一个属性取某个值的所有记录都属于一个决策类型,则认为从该属性能直接判断类属性取值的能力较强,应该在原相似度计算方法的基础之上提升该属性的相似度,从而选择相似度高的属性作为测试属性,尽量避免选择取值较少的属性,在每分割一次数据集之后,重新计算相似度。为了避免出现过度拟合现象,采用剪枝技术修整决策树。 采用SQLSERVER数据库,使用VC#.net开发工具,应用改进的决策树算法,开发了师资流失原因分析系统,用于挖掘教师的各特征取值和流失原因之间的潜在关系,通过分析教师数据中体现出来的特性,为每一个流失原因找到一种准确的描述或模型。该系统实现的关键技术在于构建决策树时属性的选择计算,以及决策树的路径如何存储这两个问题。 系统测试证明,根据改进算法生成的决策树提取的决策规则十分有效,分类结果与实际基本相符,极大地提高了系统的工作效率。挖掘结果表明改进后的算法比基于属性相似度的分类算法和著名的ID3算法的预测精度都要高,计算相对于ID3算法更为简便。
其他文献
人脸检测作为人脸识别技术的基础,近年来一直是人工智能和模式识别领域的研究热点,人脸自动检测具有重要的应用和理论研究价值。首先,稳定、高效的人脸自动检测是各种人脸图
无线Ad Hoc网络的组网灵活性及抗毁性等特点,使其在军用和民用领域内得到了广泛的应用,但是其剧烈变化的拓扑结构、有限的带宽资源以及共享信道上的竞争冲突给Ad Hoc网络技术的
近几年来,中国成为全球盲人数量最多的国家。由于视觉障碍的限制,出行成为盲人的巨大难题。现在,城市中都修建了盲道,帮助盲人出行。本文以各种现有盲道作为处理对象,提出盲
企业应用集成能够通过计算机硬件、软件、标准和业务过程的结合,实现多个孤立应用的无缝集成,从而使它们可以相互通信。传统的企业应用集成解决方案,主要是点到点的集成和基于中
无线网格(Wireless Mesh)是最近几年新兴的网络连结方式。它具有极大的灵活性、便利性和适应性,将成为今后几十年的主流网络连结方式。但是因为每个节点都要为其他节点传递信
基于模型的诊断(Model-based diagnosis, MBD)作为一项灵活性高的推理技术,克服了传统专家诊断方法的缺点,极大地推动了人工智能向前发展。近年来,随着系统集成化、自动化程
随着社会的发展和人类生活水平的不断提高,人们对医疗技术的需求也在急速增长,微创手术的广泛应用将是未来医学的一个发展方向。手术导航系统作为计算机辅助手术的重要应用,
工作流技术是进入90年代后计算机应用领域的一个新的研究热点,对工作流进行深入的研究对于提高企业信息化程度、业务运行效率,降低业务成本,从而整体提升企业的竞争力有着重
“计算机基础教学平台”和“在线考试系统”属于大学计算机基础教学改革项目,这两套系统是使用动态Web技术构建的应用系统。目前两套系统的硬件体系结构为单一的Web服务器体系
虚拟专用网是指采用隧道技术以及加密、身份认证等方法,在公共网络(如Internet)上构建专用网络的技术,数据通过安全的“加密通道”在公众网络中传输。随着企业信息化程度的发展,对