数据挖掘在研究生调剂中的应用研究

来源 :江苏科技大学 | 被引量 : 3次 | 上传用户:saintdong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
调剂是研究生招生的重要环节,能否做好调剂工作不但关系到考生的利益,而且关系到招生单位招生的成功与否。由于考生和招生单位各自特点的复杂性、多样性,所以做好调剂工作是一件很复杂的事情。目前,研究生调剂主要采用的方法是考生分析学校特点和自身条件,主观填报调剂志愿。但是,由于招生单位数量众多、属性复杂,考生很难准确分析每个学校的特点,这就造成大量调剂不成功的现象,从而导致考生落榜和招生单位不能完成招生计划的情况。本文把数据挖掘技术应用到研究生调剂工作中,为广大考生和招生单位提供决策支持,提高了研究生调剂的效率,可以较好的解决研究生调剂工作中的难点问题。本文主要思路和工作如下:通过分析研究生调剂的特点,把调剂分成两个部分,首先对调剂学校进行分类,把招生条件类似的学校归为一类,这样把学校分成四个等级;其次按考生的各方面条件对需要调剂的考生进行归类,找出适合本考生条件的学校类型,考生可以在该类学校中选择自己喜欢的学校。对于学校的分类,通过分析学校属性的特点,选用ID3决策树算法,通过对ID3算法分析,发现ID3算法在处理分类结果取值较多的分类的时候运算效率较低,鉴于这样的缺点本文利用麦克劳林公式消除原信息熵公式中的相关函数,从而提高了运算效率,同时对信息熵的计算作适当的变换,这样可以消除属性取值个数对信息熵的影响,避免不重要的属性因取值较多而计算出的信息熵较大。利用改进的ID3算法建立决策树,对学校进行分类,与传统ID3算法比较,证明了改进算法的可行性和高效性。对于考生的归类,鉴于考生属性的多样性、模糊性和难于标识等特点,本文设计了一个半监督学习算法对考生进行归类,半监督学习算法的主要优点在于能利用少量的容易标识的样本,对大量难以标识的样本进行分类。最后在改进的ID3算法和半监督学习算法基础上建立研究生调剂系统模型,基于建立的研究生调剂系统模型设计和实现了简易的调剂系统。系统的核心功能包括:根据考生条件推荐合适级别的学校、学校信息查询等。通过测试数据进行测试,测试结果与真实的调剂结果基本吻合,本模型具有可行性和一定的使用推广价值。
其他文献
21世纪被称为海洋的世纪。海洋是地球系统的重要组成部分,它是一个非常复杂的生态系统,其中有各种不同时空尺度和不同层次的物质存在和运动形态。海洋在地球环境中起到了非常重
学习方法的泛化能力、学习效率和易用性是机器学习及其应用过程中所面临三个关键性问题。神经网络集成学习通过训练多个神经网络并将其结果进行合成,显著地提高了系统的泛化
随着金融机构的改革步伐的加快,机构资产数量和类别越来越复杂,金融机构监管制度不断的完善,对资产管理信息化建设提出了更高的要求。资产管理作为企业信息化平台建设中的重
无线传感网络作为现代化信息时代的一项重要的革命性的技术,自诞生以来都受到诸多学者的关注,在军事、交通、生物监测、医疗等领域起到了不可替代的作用。然而节点电池电量限
随着信息技术、计算机产业以及互联网技术的迅速发展,嵌入式系统因具有高度集成化、高稳定性、功能定制化、低功耗、高安全性、高性价比等特点成为当今应用系统领域研究开发
随着成都市交通枢纽构建工作的快速发展,成都市出租车汽车行业、道路客运行业和公共汽车行业以及成都市民对于交通行业的服务质量水平的需求也在不断的提高。因此,对于成都市
决策支持系统是一种以辅助管理者进行决策为目标的计算机系统,它为管理者提供了分析、模型构造、决策过程模拟及决策效果评价的决策支持环境。模型库是核心,它把众多的模型有
原木材积的检测在现代木材工业的发展中占有重要的地位,目前,原木材积检测主要采用传统的人工检尺方法,该方法工作效率低、计算精度差,测量结果的准确度难以保证。随着木材工
云存储是在随着Internet的发展,传统的网络存储架构已不能满足当下全球信息量的爆炸式增长的背景下,基于云计算的概念而提出来的新概念。自其概念提出以来就倍受全球众多IT厂商
随着我高速铁路信息化的发展,有关高速铁路的数据分析在保证高铁安全舒适的运营和整个国民经济的持续发展中将会起到更加重要的作用。然而,由于环境等复杂因素,采集得到的动