NERMS中基于决策树算法的用户特征分类设计与实现

来源 :吉林大学 | 被引量 : 0次 | 上传用户:169
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
NERMS(Network Educational Resource Management System)项目是由吉林省科委立项、吉林大学计算机科学与技术学院知识工程实验室承建的省级重大大中型项目。NERMS的主要目标是对繁多的网络教学资源进行有效的组织和管理,以便于网络教学资源的高效共享和获取。由于NERMS项目要求为NERMS系统的用户提供智能化和个性化的服务,本文开展了基于决策树算法的用户特征分类的研究工作。用户特征分类采用基于决策树的数据挖掘算法,根据用户的个人属性信息结合用户的购买行为以及个人爱好信息等用户特征,挖掘出一系列有价值的规则,向每类用户有目的的推荐某种商品资源。为了更好的对用户个人信息进行分类处理,需要对数据进行预处理。可以采用属性归纳分析的方法,消除无关或弱相关的冗余属性,获取和用户特征最为相关的属性。当获得一定数量的样本记录之后,可以利用决策树方法来进行学习,建立一个由用户属性作为结点的决策树。通过决策树可以发现那些和用户特征最为相关的一些用户属性。同时可以将决策树转换为更为直观的IF-THEN形式的分类规则知识。用户分类模块首先利用C4.5算法对连续属性进行离散化处理,而后采用ID3算法建立决策树,并将所形成的决策树转化为IF-THEN的规则知识形式。该规则可用于对用户进行分类,预测用户特征以及购买行为或个人爱好等信息。 <WP=52>本文采用MVC多层次体系结构,运用J2EE技术来完成系统的开发,并使用IBM公司的DB2作为后台数据库管理系统,IBM WebSphere Studio Application Developer作为开发测试环境,Websphere Application Server 作为后台应用服务器。整个开发过程思路清晰,层次分明,调试灵活。系统在测试环境下,试运行三个月,经实验证明已经成功的应用到NERMS系统当中。
其他文献
本人参与了"辽河油田渤高稀油管线管道泄漏自动监测报警系统"的设计研制工作,并负责软件系统结构设计和大部分软件编制工作.本文以此次实践为基础,论述了该检测系统的设计方
学位
软件系统复杂性的不断增加和应用需求的不断扩大,使软件开发面临着前所未有的挑战,软件危机作为一种慢性危机还在继续。使得怎样提高软件开发的效率和质量成为研究热点。软件组
近年来,随着信息技术的快速发展,计算需求日益增加,计算成本不断提高,集群技术凭借其在计算方面高性价比的优势,在各应用领域得到了广泛的认可。然而,在集群技术被普遍使用的
随着互联网的广泛发展,如何保证用户能够在"海量信息"中迅速准确的获得想要的信息,已经成为互联网研究和应用上十分迫切的问题.作为语义网核心技术的本体论方法,具有改进信息
富文本格式(Rich Text Format)是Microsoft公司所开发的一种规格说明,这种规格说明是一种将格式化文本和图形进行编码的方法,目的是使得在各种应用程序之间传递文本和图形变得更
本文在进行充分的理论论证和计算机模拟基础上给出了短波高速调制解调器的实现方案,并给出了其主要关键技术如自适应均衡、差错控制方案等的设计方案和计算机模拟结果,给出了
现代生产过程通常具有多变量、时变、非线性、环境复杂等许多特点,传统意义上的自动控制技术已经不能充分满足现代生产的需要。随着计算机控制技术、软件工程理论、现场总线智
新的信息革命正在改变我们的日常生活,这场革命的核心是软件业.软件业是一个快速发展变化的产业,在这个发展变化过程中企业应用系统向着大型化、复杂化、高度集成的方向发展.
分布式数据库系统在带来高度数据共享的同时,无疑也为其安全带来严峻考验.访问控制作为应用最为广泛且最为有效的安全控制机制,一直就是数据库安全研究的重点.近几年,基于角