论文部分内容阅读
调剂是研究生招生的重要环节,能否做好调剂工作不但关系到考生的利益,而且关系到招生单位招生的成功与否。由于考生和招生单位各自特点的复杂性、多样性,所以做好调剂工作是一件很复杂的事情。目前,研究生调剂主要采用的方法是考生分析学校特点和自身条件,主观填报调剂志愿。但是,由于招生单位数量众多、属性复杂,考生很难准确分析每个学校的特点,这就造成大量调剂不成功的现象,从而导致考生落榜和招生单位不能完成招生计划的情况。本文把数据挖掘技术应用到研究生调剂工作中,为广大考生和招生单位提供决策支持,提高了研究生调剂的效率,可以较好的解决研究生调剂工作中的难点问题。本文主要思路和工作如下:通过分析研究生调剂的特点,把调剂分成两个部分,首先对调剂学校进行分类,把招生条件类似的学校归为一类,这样把学校分成四个等级;其次按考生的各方面条件对需要调剂的考生进行归类,找出适合本考生条件的学校类型,考生可以在该类学校中选择自己喜欢的学校。对于学校的分类,通过分析学校属性的特点,选用ID3决策树算法,通过对ID3算法分析,发现ID3算法在处理分类结果取值较多的分类的时候运算效率较低,鉴于这样的缺点本文利用麦克劳林公式消除原信息熵公式中的相关函数,从而提高了运算效率,同时对信息熵的计算作适当的变换,这样可以消除属性取值个数对信息熵的影响,避免不重要的属性因取值较多而计算出的信息熵较大。利用改进的ID3算法建立决策树,对学校进行分类,与传统ID3算法比较,证明了改进算法的可行性和高效性。对于考生的归类,鉴于考生属性的多样性、模糊性和难于标识等特点,本文设计了一个半监督学习算法对考生进行归类,半监督学习算法的主要优点在于能利用少量的容易标识的样本,对大量难以标识的样本进行分类。最后在改进的ID3算法和半监督学习算法基础上建立研究生调剂系统模型,基于建立的研究生调剂系统模型设计和实现了简易的调剂系统。系统的核心功能包括:根据考生条件推荐合适级别的学校、学校信息查询等。通过测试数据进行测试,测试结果与真实的调剂结果基本吻合,本模型具有可行性和一定的使用推广价值。