论文部分内容阅读
NERMS(Network Educational Resource Management System)项目是由吉林省科委立项、吉林大学计算机科学与技术学院知识工程实验室承建的省级重大大中型项目。NERMS的主要目标是对繁多的网络教学资源进行有效的组织和管理,以便于网络教学资源的高效共享和获取。由于NERMS项目要求为NERMS系统的用户提供智能化和个性化的服务,本文开展了基于决策树算法的用户特征分类的研究工作。用户特征分类采用基于决策树的数据挖掘算法,根据用户的个人属性信息结合用户的购买行为以及个人爱好信息等用户特征,挖掘出一系列有价值的规则,向每类用户有目的的推荐某种商品资源。为了更好的对用户个人信息进行分类处理,需要对数据进行预处理。可以采用属性归纳分析的方法,消除无关或弱相关的冗余属性,获取和用户特征最为相关的属性。当获得一定数量的样本记录之后,可以利用决策树方法来进行学习,建立一个由用户属性作为结点的决策树。通过决策树可以发现那些和用户特征最为相关的一些用户属性。同时可以将决策树转换为更为直观的IF-THEN形式的分类规则知识。用户分类模块首先利用C4.5算法对连续属性进行离散化处理,而后采用ID3算法建立决策树,并将所形成的决策树转化为IF-THEN的规则知识形式。该规则可用于对用户进行分类,预测用户特征以及购买行为或个人爱好等信息。 <WP=52>本文采用MVC多层次体系结构,运用J2EE技术来完成系统的开发,并使用IBM公司的DB2作为后台数据库管理系统,IBM WebSphere Studio Application Developer作为开发测试环境,Websphere Application Server 作为后台应用服务器。整个开发过程思路清晰,层次分明,调试灵活。系统在测试环境下,试运行三个月,经实验证明已经成功的应用到NERMS系统当中。