论文部分内容阅读
摘要:本文以镇江市高等专科学校医药与化材学院毕业生的就业质量为预测目标,采用单双隐层神经网络作为预测模型,通过比较模型训练时的预测精度,模型仿真时的预测时间及精度,比较单双隐层的预测能力。实验结果表明,对于较小输入层神经元数的BP神经网络模型而言,采用单隐层是较为合理的,预测精度也较高。采用双隐层模型将会导致模型运算复杂化,预测精度反而降低。
关键词:就业质量;神经网络;贡献率;预测
中图分类号:G642.0;TP393 文献标志码:A 文章编号:1674-9324(2018)29-0037-03
一、引言
高职院校学生的就业质量一直是社会普遍关注的焦点,如何有效地对大学生的就业质量进行预判,是当前社会研究的热点。目前,有大量的研究采用反向传播(Back Propagation)神经网络对大学生的就业率、就业能力、就业情况进行分析,取得了令人满意的研究成果。但目前关于采用BP神经网络对高职院校大学生就业质量的分析研究仍然较少。同时,影响高职院校大学生就业质量的因素众多,如知识因素、个人因素等,如果将众多的因素量化并建立数据库时,数据库便显得庞大繁杂。模型结构及参数的设定可能就会对模型的训练速度及精度有所影响,最终对就业质量的预测精度造成影响。因此,需要对模型的结构及参数的设定进行探讨,寻找到预测高职院校大学生就业质量的最佳模型。
因此,本文尝试采用两种不同结构的BP神经网络模型对大学生的就业质量进行分析,对不同隐层数的模型的预测精度进行比较分析。
二、BP神经网络
BP网络(Back Propagation)是一种按误差逆传播算法训练的多层前馈网络,是目前应用最为广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。该网络主要包括了一个输入层和一个输出层,中间包含了一个或者多个隐含层。每层都具有一定数量的神经元,输入层的神经元数目对应着影响目标值的各因素数目。层与层之间的神经元存在着权值和阈值,具体的计算公式可参考文献。
三、研究方法
1.模型数据库的建立。对医药与化材学院的近三年毕业生采取问卷调查形式,问卷调查内容涵盖了影响大学生就业质量的知识因素及个人因素,例如知识因素中的专业知识因素主要包含了外语过级情况、毕业生在校期间的班级排名等,个人因素包含了“自我自覺性评价”“自我实践能力评价”“自我表达能力评价”“自我抗压能力评价”“自我创新性评价”等。建立模型时需将各个因素进行量化,如“自我实践能力评价”分为“很强”“较强”“一般”“弱”四个选项,在建立数据库时分别设定值为“0.99”“0.75”“0.5”“0.25”,将“目前工作的满意度及未来发展前景”作为大学生就业质量的最终评价标准,其选项中“非常满意”“满意”“一般”“不满意”分别设定值为“0.99”“0.75”“0.5”“0.25”。将各个因素有规律的量化是建立数据库的基本要求,部分训练样本的数据如表1所示。10个样本的就业质量目标值量化后分别对应0.75、0.5、0.5、0.75、0.75、0.5、0.5、0.75、0.5、0.75。整个调查问卷过程回收有效问卷85份,任意选择75份样本数据建立数据库以供模型训练,剩余10样本数据作为“验证组”,将与模型的“预测组”进行比较,判断模型的预测精度。
2.模型主要参数的确定。
(1)传递函数及训练函数的确定。BP神经网络建模过程可直接采用MATLAB工具箱实现,MATLAB提供了神经网络工具箱,网络设计者可根据自己的需求直接调用工具箱中有关神经网络的设计及训练程序。神经网络工具箱提供了建立神经网络的专用函数newff ( ),该函数的调用格式为:net=newff(PR,[S1 S2 … SN],{TF1 TF2 … TFN},BTF,BLF,PF),其中PR为数据的取值范围,通常原始数据都要经过归一化处理,处理后其值范围在[-1,1]之间。Si为第i层的神经元数,总共N层,TFi为第i层的传递函数,本文单、双隐层的传递函数都设定为“tansig”,输出层的传递函数设为“purelin”。同时,训练函数选择“traingdm”函数,该函数采用了有动量的梯度下降法,具有较高的训练精度。
(2)单隐层BP神经网络隐含层神经元数的确定。本文隐含层神经元数的确定参考高大启提供的一个经验公式:
S=0.51 ■(1)
式中,m为输入层神经元数,n为输出层神经元数,S为隐含层神经元数,本文输入层神经元数为9,输出层神经元数为1,通过计算可得隐含层神经元数为6,因此,本文尝试大的隐含层神经元数分别为4、5、6、7。
(3)双隐层BP神经网络隐含层神经元数的确定。参考单隐层BP神经网络的隐含层神经元数,双隐层第一层神经元数分别为5、6、7,第二层神经元数分别为5、6、7,因此共有九个不同结构的双隐层神经网络。
(4)学习率及其他训练参数的确定。本文的学习率设定为0.1,精度设定为0.02,训练步数设定为200000,训练步长设定为1000。
(5)Matlab的主要程序。
单隐层BP模型引用程序为:
net=newff(minmax(P),[X,1],{’tansig’,’purelin’},’traingdm’);
双隐层BP模型引用程序为:
net=newff(minmax(P),[X,Y,1],{’tansig’,’tansig’,’purelin’},’traingdm’);
其中,P为用于训练的样本各因素量化后的数据库,X与Y分别为第一层与第二层隐含层的神经元数目,T为用于训练的样本目标量化后的数据,Pn为用于模型验证的原始数据。 四、BP神经网络模型的仿真
本文采用了75个样本建立数据库用于BP神经网络模型的训练,10个样本数据用于模型性能的预测,实验結果如表2与表3所示。本文的预测目标是大学生的就业质量,采用的是“目前工作的满意度以及未来发展前景”作为就业质量的评价标准。因为本文采用了统计学模型进行数据分析,因此模型仿真后的值为具体数值,需要进一步对应其满意度,转化后的预测满意度与实际满意度如表3所示。例如当单隐含层的神经元数为6时,样本4的预测值为0.6216,相比较0.75,0.6216更加接近0.5,因此对应的满意度为“一般”,与实际值相同。
从表3可以看出,当隐含层数为一层,隐含层神经元数为5时,模型预测的精确度达到了90%,其他结构模型的预测精度都低于该模型。特别是对于双隐层BP神经网络而言,当隐含层节点数为6/6时,模型的预测精度为80%,可以看出,单隐层神经网络模型的预测精度要高于双隐层神经网络模型。这就从侧面说明单隐层BP神经网络是具备了高精度的预测性能。
对于单隐层的BP神经网络模型而言,随着隐含层神经元数的增加,模型的预测精度呈现了一个先增加后降低的趋势,说明当采用BP神经网络模型进行预测时,隐含层神经元数的选择对预测精度有重大影响。合理选择隐含层神经元可提高模型的预测精度。
五、结论
本文采用了单、双隐含层的BP神经网络对大学生的就业质量进行了预测,当隐含层神经元数为6时,模型的预测精度达到了90%,说明该模型具有非常高的预测精度,模型具备了很强的适用性。当对小样本数据进行训练时,可以采用单隐层的BP神经网络。
参考文献:
[1]马丹丹,于占龙,刘越.BP神经网络在大学毕业生就业率预测中的研究与应用[J].佳木斯大学学报(自然科学版),2014,32(5):751-753.
[2]杨光军.灰色理论和BP神经网络在大学生就业信心指数预测中的应用[J].数学的实践与认识,2013,15(6):62-67.
[3]吴振磊,刘孝赵.一种基于BP神经网络的就业分析预测模型[J].轻工科技,2016,(9):70-71.
[4]陈立俊,王克强.基于人工神经网络方法的大学生就业问题探析[J].教育发展研究,2013,13-14.
[5]佘其平,邓娟,李庆.基于BP神经网络的大学生就业情况分析[J].现代商贸工业,2015,36(25),139-141.
[6]童辉杰,杨雅婕,吕航.应用神经网络模型对大学毕业生就业质量的预测[J].人类工效学,2012,(3):20-23.
[7]周勇.大学生就业对我国经济的现实影响及建议[J].唐山学院学报,2016,28(1):100-104.
[8]叶斌,雷燕.关于BP网中隐含层数及节点数选取方法浅析[J].商丘职业技术学院学报,2004,3(15):52-53.
关键词:就业质量;神经网络;贡献率;预测
中图分类号:G642.0;TP393 文献标志码:A 文章编号:1674-9324(2018)29-0037-03
一、引言
高职院校学生的就业质量一直是社会普遍关注的焦点,如何有效地对大学生的就业质量进行预判,是当前社会研究的热点。目前,有大量的研究采用反向传播(Back Propagation)神经网络对大学生的就业率、就业能力、就业情况进行分析,取得了令人满意的研究成果。但目前关于采用BP神经网络对高职院校大学生就业质量的分析研究仍然较少。同时,影响高职院校大学生就业质量的因素众多,如知识因素、个人因素等,如果将众多的因素量化并建立数据库时,数据库便显得庞大繁杂。模型结构及参数的设定可能就会对模型的训练速度及精度有所影响,最终对就业质量的预测精度造成影响。因此,需要对模型的结构及参数的设定进行探讨,寻找到预测高职院校大学生就业质量的最佳模型。
因此,本文尝试采用两种不同结构的BP神经网络模型对大学生的就业质量进行分析,对不同隐层数的模型的预测精度进行比较分析。
二、BP神经网络
BP网络(Back Propagation)是一种按误差逆传播算法训练的多层前馈网络,是目前应用最为广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。该网络主要包括了一个输入层和一个输出层,中间包含了一个或者多个隐含层。每层都具有一定数量的神经元,输入层的神经元数目对应着影响目标值的各因素数目。层与层之间的神经元存在着权值和阈值,具体的计算公式可参考文献。
三、研究方法
1.模型数据库的建立。对医药与化材学院的近三年毕业生采取问卷调查形式,问卷调查内容涵盖了影响大学生就业质量的知识因素及个人因素,例如知识因素中的专业知识因素主要包含了外语过级情况、毕业生在校期间的班级排名等,个人因素包含了“自我自覺性评价”“自我实践能力评价”“自我表达能力评价”“自我抗压能力评价”“自我创新性评价”等。建立模型时需将各个因素进行量化,如“自我实践能力评价”分为“很强”“较强”“一般”“弱”四个选项,在建立数据库时分别设定值为“0.99”“0.75”“0.5”“0.25”,将“目前工作的满意度及未来发展前景”作为大学生就业质量的最终评价标准,其选项中“非常满意”“满意”“一般”“不满意”分别设定值为“0.99”“0.75”“0.5”“0.25”。将各个因素有规律的量化是建立数据库的基本要求,部分训练样本的数据如表1所示。10个样本的就业质量目标值量化后分别对应0.75、0.5、0.5、0.75、0.75、0.5、0.5、0.75、0.5、0.75。整个调查问卷过程回收有效问卷85份,任意选择75份样本数据建立数据库以供模型训练,剩余10样本数据作为“验证组”,将与模型的“预测组”进行比较,判断模型的预测精度。
2.模型主要参数的确定。
(1)传递函数及训练函数的确定。BP神经网络建模过程可直接采用MATLAB工具箱实现,MATLAB提供了神经网络工具箱,网络设计者可根据自己的需求直接调用工具箱中有关神经网络的设计及训练程序。神经网络工具箱提供了建立神经网络的专用函数newff ( ),该函数的调用格式为:net=newff(PR,[S1 S2 … SN],{TF1 TF2 … TFN},BTF,BLF,PF),其中PR为数据的取值范围,通常原始数据都要经过归一化处理,处理后其值范围在[-1,1]之间。Si为第i层的神经元数,总共N层,TFi为第i层的传递函数,本文单、双隐层的传递函数都设定为“tansig”,输出层的传递函数设为“purelin”。同时,训练函数选择“traingdm”函数,该函数采用了有动量的梯度下降法,具有较高的训练精度。
(2)单隐层BP神经网络隐含层神经元数的确定。本文隐含层神经元数的确定参考高大启提供的一个经验公式:
S=0.51 ■(1)
式中,m为输入层神经元数,n为输出层神经元数,S为隐含层神经元数,本文输入层神经元数为9,输出层神经元数为1,通过计算可得隐含层神经元数为6,因此,本文尝试大的隐含层神经元数分别为4、5、6、7。
(3)双隐层BP神经网络隐含层神经元数的确定。参考单隐层BP神经网络的隐含层神经元数,双隐层第一层神经元数分别为5、6、7,第二层神经元数分别为5、6、7,因此共有九个不同结构的双隐层神经网络。
(4)学习率及其他训练参数的确定。本文的学习率设定为0.1,精度设定为0.02,训练步数设定为200000,训练步长设定为1000。
(5)Matlab的主要程序。
单隐层BP模型引用程序为:
net=newff(minmax(P),[X,1],{’tansig’,’purelin’},’traingdm’);
双隐层BP模型引用程序为:
net=newff(minmax(P),[X,Y,1],{’tansig’,’tansig’,’purelin’},’traingdm’);
其中,P为用于训练的样本各因素量化后的数据库,X与Y分别为第一层与第二层隐含层的神经元数目,T为用于训练的样本目标量化后的数据,Pn为用于模型验证的原始数据。 四、BP神经网络模型的仿真
本文采用了75个样本建立数据库用于BP神经网络模型的训练,10个样本数据用于模型性能的预测,实验結果如表2与表3所示。本文的预测目标是大学生的就业质量,采用的是“目前工作的满意度以及未来发展前景”作为就业质量的评价标准。因为本文采用了统计学模型进行数据分析,因此模型仿真后的值为具体数值,需要进一步对应其满意度,转化后的预测满意度与实际满意度如表3所示。例如当单隐含层的神经元数为6时,样本4的预测值为0.6216,相比较0.75,0.6216更加接近0.5,因此对应的满意度为“一般”,与实际值相同。
从表3可以看出,当隐含层数为一层,隐含层神经元数为5时,模型预测的精确度达到了90%,其他结构模型的预测精度都低于该模型。特别是对于双隐层BP神经网络而言,当隐含层节点数为6/6时,模型的预测精度为80%,可以看出,单隐层神经网络模型的预测精度要高于双隐层神经网络模型。这就从侧面说明单隐层BP神经网络是具备了高精度的预测性能。
对于单隐层的BP神经网络模型而言,随着隐含层神经元数的增加,模型的预测精度呈现了一个先增加后降低的趋势,说明当采用BP神经网络模型进行预测时,隐含层神经元数的选择对预测精度有重大影响。合理选择隐含层神经元可提高模型的预测精度。
五、结论
本文采用了单、双隐含层的BP神经网络对大学生的就业质量进行了预测,当隐含层神经元数为6时,模型的预测精度达到了90%,说明该模型具有非常高的预测精度,模型具备了很强的适用性。当对小样本数据进行训练时,可以采用单隐层的BP神经网络。
参考文献:
[1]马丹丹,于占龙,刘越.BP神经网络在大学毕业生就业率预测中的研究与应用[J].佳木斯大学学报(自然科学版),2014,32(5):751-753.
[2]杨光军.灰色理论和BP神经网络在大学生就业信心指数预测中的应用[J].数学的实践与认识,2013,15(6):62-67.
[3]吴振磊,刘孝赵.一种基于BP神经网络的就业分析预测模型[J].轻工科技,2016,(9):70-71.
[4]陈立俊,王克强.基于人工神经网络方法的大学生就业问题探析[J].教育发展研究,2013,13-14.
[5]佘其平,邓娟,李庆.基于BP神经网络的大学生就业情况分析[J].现代商贸工业,2015,36(25),139-141.
[6]童辉杰,杨雅婕,吕航.应用神经网络模型对大学毕业生就业质量的预测[J].人类工效学,2012,(3):20-23.
[7]周勇.大学生就业对我国经济的现实影响及建议[J].唐山学院学报,2016,28(1):100-104.
[8]叶斌,雷燕.关于BP网中隐含层数及节点数选取方法浅析[J].商丘职业技术学院学报,2004,3(15):52-53.