1、关于大学毕业生就业情况的研究目录摘要0一、问题提出2二、基本假设2三、建立模型及其检验、求解、评价2(一)问题1:确定影响大学生就业的主要因素2(二)问题2:评价不同专业毕业生就业情况7(三)问题3:给出某一专业毕业生的就业策略8(四)问题4:探讨毕业生就业情况与地区经济发展水平间的关系9(五)问题5:有关我校毕业生就业的意见10四、参考文献12五、附录121MATLAB操作示意图(一)122MATLAB操作示意图(二)123MATLAB操作示意图(三)12MATLAB操作示意图(一)0MATLAB操作示意图(二)0MATLAB操作示意图(三)1摘要本文探讨了在教育大众化的时代背景下,如何优化
2、大学生就业状况的问题。通过对影响大学生就业率因素的合理分析,我们在合理假设的基础上建立逐步回归分析模型,并求解模型给出具体排序情况,最后提出各项针对性建议。问题一:确定影响大学生就业的主要因素。首先,对影响毕业生就业的因素进行合理假设,设定只有性别、年龄、学历等十项因素对就业情况构成影响,并随机抽样选取样本。其次,引入虚拟变量将文字信息量化,得到数据矩阵。建立多元线性回归模型(Y = b0 + b1D1 + b2D2 + + biDi + )及逐步回归分析模型。最后,利用MATLAB软件中Stepwise(x,y,inmodel,alpha)命令对样本数据进行运算,求解模型,得出线性方程及相关
3、数据:判定系数R2 ,标准误差,相关系数r,F检验值。综合各指标得到影响就业率的主要因素为:课程是否适合社会、专业是否对口、政治面貌、专业前景、性别、年龄、初次学历。问题二:评价不同专业毕业生就业情况。在进一步假设的基础上选取样本数据,分别计算各专业的就业率、初始薪金均值及目前薪金均值,在作图比较的分析下给出客观评价。问题三:给出某一专业毕业生的就业策略。我们选定“经济学”专业毕业生作为研究对象,再次利用逐步回归模型,探究在该专业毕业生就业情况中起主要作用的因素,以此为依据就初始学历、专业是否对口等方面提出针对性策略建议。问题四:结合实际探讨毕业生就业情况与地区经济发展水平间的关系。在明确研究
4、背景的基础上,我们选取了八个不同城市作为研究对象,分别计算该地大学毕业生就业率,得出地区经济发展现状与就业率呈正相关的结论。问题五:对我校毕业生就业提出指导性建议。在本题研究成果的基础上,结合我校实际,分析了就业压力、自身期望、企业需求等方面的现存问题,从就业观、薪金要求、专业对口等几个方面给出就业指导建议。关键词:虚拟变量;回归分析;逐步回归模型;相关性系数一、问题提出随着我国大学教育逐步向大众化方向转变,招生数量连年增多,导致大学毕业生就业情况逐步严峻。2007年全国普通高校毕业生将达到495万,比2006年增加82万。大学毕业生的就业率高低,既有社会整体大环境的因素,也有专业结构、培养方
5、向、教学方式、学生学习态度等多方面的原因。附件给出了一个七千多名毕业生的调查数据,请你根据这些数据,建立相应的数学模型,研究以下问题:(1)影响毕业生就业的主要因素是什么,并对相关因素进行排序;(2)评价不同专业的毕业生就业情况;(3)给出某一专业的毕业生的就业策略;(4)请你结合其他信息对毕业生就业与区域经济发展水平之间的关系作出评价;(5)结合中央民族大学本科教育现状,写一篇对在校生今后就业具有实际指导意义的短文。21世纪是知识的时代,人才是国家发展的先决条件。大学毕业生的就业情况关乎社会发展状况与人才利用效率,通过数学模型的建立对影响就业率的各项因素进行深入分析研究,具有重大的实际意义。
6、二、基本假设在本次研究中做出以下假设:1假设毕业生就业情况只受性别、年龄、政治面貌、户口性质、初次学历、专业前景、专业是否对口、课程是否适合社会、初次月薪及目前月薪等十项因素的影响。2假设具有上述同等条件的毕业生间就业机会相同。3假设附件中的数据信息均合理。三、建立模型及其检验、求解、评价(一)问题1:确定影响大学生就业的主要因素1.1 问题分析与建模思想此题要在众多的就业率影响因素中选取主要因素,并对其进行排序。首先需要研究变量间的相关关系,多元线性回归分析模型可解决这一问题;但进一步的,我们希望从所有的影响因素中挑选出对就业率影响显著的项目,并且从应用的角度讲,变量个数尽可能少,而逐步回归
7、模型则可有效实现这一目标。逐步回归的基本思想是:先确定一个包含若干自变量的初始集合,然后每次从集合外变量中引入一个对因变量影响最大的,再对集合中的变量进行检验,从变得不显著的变量中移出一个影响最小的,依此进行,直到不能引入和移出为止。引入和移出都以给定的显著性水平为标准。当这一过程完成时,回归方程中所有自变量对因变量都是显著的。逐步回归的思想简明易懂,但具体运算操作非常复杂,我们可以利用MATLAB软件方便的实现这一思想。1.2 符号说明l Di:影响因素虚拟变量(i=1,2,3,20)l Yi:就业情况虚拟变量 (i=1,2,3,20)l Coefficients:相关性系数l R2 :判定
8、系数l F:显著性检验l P-value:F统计量对应的概率值l RMSE:剩余标准差1.3 建立模型 第一步:抽取样本考虑到数据总量庞大,从中抽取部分数据作为样本。我们采取简单随机抽样的方法,具体操作如下:1) 在EXCEL环境下对所有数据进行1-40的重复编号;2) 在“数据”菜单下选用“自动筛选”命令,选取所有编号为“1”的数据;3) 重复进行该操作若干次,最终选取19条数据作为研究样本。 第二步:引入虚拟变量在回归分析模型中,解释变量均为定性变量的模型称为方差分析模型(analysis-of-variance models)(ANOVA),本题即为此状。现建立人工变量,将定性变量“定量
9、化”,具体赋值情况如下:D1:性别虚拟变量,设D2:年龄虚拟变量,设 D3:政治面貌虚拟变量,设D4:户口性质虚拟变量,设D5:初次学历虚拟变量,设D6:专业前景虚拟变量,设D7:专业是否对口虚拟变量,设D8:课程是否适合社会虚拟变量,设D9:初次月薪虚拟变量,设D10:目前月薪虚拟变量,设Y:就业状况,设经过上述量化过程,样本数据排列为下面的矩阵形式:就业情况性别年龄政治面貌户口性质专业对口初次学历专业前景课程适合社会初次月薪目前月薪11113111111111121011011111211100000012101010111121111111010211110011013111111111
10、131111111111311111111103111101100130100001101200110010003101101100121011101000310100011113101000111031111110111100101011013101000 第三步:建立多元线性回归模型1本题需要研究各个因素与大学毕业生就业率之间的关系,故建立多元线性回归的一般模型:Y = b0 + b1D1 + b2D2 + + biDi + ,其中,b0 ,b1 ,b2 , ,bi 是未知数参数,b0 为回归模型的常数,为随机误差。假定 N( 0 , 2),即 E(y)= b0 + b1D1 + b2D2
11、 + + biDi . 第四步:引入逐步回归模型2进一步的,本题要求找出影响大学毕业生就业率的主要因素,即从若干变量中选取对就业率影响最大的几个因素,并使自变量个数尽量少。为实现这一目标,引入逐步回归模型。逐步回归模型的基本思想如前1.1节中所述,在此不再重复。本题中的因变量为就业情况,自变量为性别、年龄、初次学历等十个因素,具体符号及赋值见1.3节所述。实际操作中,我们主要运用MATLAB进行求解。 第五步:模型求解利用MATLAB软件进行模型求解。在MATLAB统计工具箱中的逐步回归命令是Stepwise,利用这个计算工具我们可以方便的完成回归变量的筛选工作。其通常的用法是Stepwise
12、(x,y,inmodel,alpha),其中:x是自变量数据,排成mn矩阵(m为自变量个数,n为每个变量的数据量);y是因变量数据,排成n1阶数据矩阵;inmodel是自变量初始集合的指标(即矩阵x中哪些列进入初始集合),缺省时设定为x的列数m;alpha为显著性水平,缺省时设为0.05.在本题中具体操作如下:1)将矩阵中的数据导入MATLAB程序,运用stepwise(D,Y)命令(根据缺省值,10个初始变量都进入初始模型),得到下图:图1 MATLAB操作界面2)由上图可以看出除D4和D10 外其他变量的回归系数置信区间都不包含零点,所以移出变量D4和D10 (相关系数与零无差异,即影响不
13、显著);我们规定线性相关系数系数低于0.7为线性不相关,则剩下变量D1,D2,D3,D5,D6,D7,D8,蓝色显示的变量D4,D10和相关性系数低于0.7的D9视为不相关。3)根据Y = b0 + b1D1 + b2D2 + + biDi + ,得到以下数据:b1=0.7895 b2=0.7673 b3=0.8930 b5=0.7445 b6=0.8374b7=0.9438 b8=0.9520Stepwise命令并未给出回归模型的常数bo 和随机误差,可以由以下方法计算得到:得bo+=-2.7770其中,分别是Y,D1,D2,D3,D5,D6,D7,D8的平均值,利用逐步回归最终得到的模型为
14、:Y=0.7895D1+0.7673D2+0.8930D3+0.7445D5+0.8374D6+0.9438D7+0.9520D8-2.77701.4 模型检验3以D1为例进行模型检验,具体情况如下:1)运用Excel的数据分析功能进行回归分析得到下表: 表1 EXCEL回归分析数据表回归统计Multiple R0.777844R Square0.605042Adjusted R Square0.549486标准误差0.61075观测值19方差分析DfSSMSFSignificance F回归分析110.2857110.2857127.574476.5E-05残差186.7142860.373
15、016总计1917Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept0#N/A#N/A#N/A#N/A#N/A#N/A#N/A政治面貌0.8571430.163235.251145.41E-050.514211.2000760.514211.200076 2)读表,得到各种检验结果如下: 标准误差 判定系数R2=0.605042 相关系数r=0.857143 F 检验值为27.57447综上所述,所得模型可以用于预测。1.5 问题解答根据上面得到的数据,我们可以得到以下结论:影响大学毕业生就业的主要因
16、素分别为(按影响作用大小排序):课程是否适合社会、专业是否对口、政治面貌、专业前景、性别、年龄、初次学历。1.6 模型评价l 该逐步回归模型具有以下优点: 逐步回归模型的思想简单易懂,且与本题要求甚为相符。 引入逐步回归模型可以免去多次重复计算多元线性回归,并且可以利用MATLAB软件简化运算。l 但由于处理水平有限,该模型有不可避免的局限性: 不能引进所有的变量。由于存在将定性变量定量化的困难,对于一些分类繁多的变量,如毕业院校、工作单位、具体毕业专业等,则无法引入该模型进行相关性分析。 数据容量有限,拟合出的方程精度不高,使得预测值与真实情况产生偏差。(二)问题2:评价不同专业毕业生就业情
17、况2.1 模型进一步假设1)假设就业情况的评价主要包括就业率、初次月薪及目前月薪。2)假设不同专业毕业生的就业状况主要由其专业类别决定。2.2 问题分析根据假设,不同专业毕业生的就业情况差异主要由其专业决定,所以可在所有数据中分专业择取部分样本进行各项指标的统计,并以此为依据评价其就业情况差异。2.3 数据统计 数据抽样利用EXCELL软件的自动筛选命令,在不同专业的数据中分别随机选出20条数据作为样本。 指标计算利用EXCELL软件的函数命令,分别对各专业的样本数据计算以下统计值:就业率,初次月薪均值,目前月薪均值。1) 利用COUNT命令统计总人数及已就业人数,计算就业率。2) 插入函数A
18、VERAGE计算初次月薪均值及目前月薪均值。 结果分析就业率是对某专业毕业生就业情况的综合评价,是其是否适合社会大生产要求的客观反映。根据前面的计算结果,由统计数据做出下图:不同专业毕业生就业率比较图00.20.40.60.81工科类管理类经济类理科类农林类师范类文史类专业就业率专业对口率图2 不同专业毕业生就业率比较图由图可知,各专业就业率差异不大。相较而言,工科类、经济类、管理类及理科类专业就业率较高,这可能与现代社会需求有关。薪金反映了毕业生就业的理想程度,也是评价就业情况的重要指标。下图为不同专业的就业薪金水平比较图:不同专业毕业生就职薪金比较图05001000150020002500
19、300035004000工科类管理类经济类理科类农林类师范类文史类专业薪金初次月薪目前月薪图3 不同专业毕业生就职薪金比较图尽管农林类与文史类的毕业生就业率不高,但就业部分的月薪水平相较其他专业类别却很高,这可能与他们的就业单位及岗位有关。综上,各专业毕业生就业情况各有所长但差别不大,工科类、经济类、管理类及理科类专业就业率较高,而农林类与文史类毕业生的就业薪金水平却相对较高。(三)问题3:给出某一专业毕业生的就业策略3.1 分析与运算任一专业的就业策略都需根据影响就业的因素来制定。现选定“经济学”专业进行分析研究。根据(1)题模型及运算方法,选取所有“经济学”专业数据作为研究对象,对该专业毕
20、业生的各项指标进行逐步回归分析,具体操作方法与问题一相同。利用MATLAB软件得到以下运算结果:Y=0.8935D1+0.7673D2+0.8930D3+0.9876D5+0.9012D6+0.9438D7+0.4520D8-2.7770由于虚拟变量系数反应该自变量对因变量的影响大小,我们可以看到,对于“经济学”专业毕业生,影响其就业率的主要因素(按作用大小排序)分别为:D5初次学历、D7专业是否对口、D6专业前景、D1性别、D3政治面貌、D2年龄。3.2 就业策略建议根据以上统计结果,结合其他文字资料我们给出如下就业策略: 尽可能获得较高的学历,这对就业起着最为主要的影响作用。不仅在就业率上
21、对低学历人群遥遥领先,而且在薪金水平上也更胜一筹。 正确树立就业观。我们看到,专业对口与否在决定就业率方面具有重要作用,所以建议经济学专业的毕业生选取合适的工作岗位与方向,但又不能拘泥于此,尽可能地增加就业机会,获得宝贵的工作经验,这也是转向更为理想工作岗位的必要条件。 在校期间加强政治素质培养。政治面貌在中国社会经济生活中扮演着一定的角色.大学生的政治面貌(党员或干部身份)对其就业可以说是一张王牌。很多时候,大学毕业生中的党员、干部在就业中都是各类企事业单位的首选。(四)问题4:探讨毕业生就业情况与地区经济发展水平间的关系4.1 问题的研究背景不同地区的就业率与就业水平存在差异,根据现实生活
22、中的真实情况反应,我国的区域发展水平存在严重的不均衡问题,因此也导致了就业的不均衡。国家人事部公布的一份数据表明,2005年仅北京、广州、上海、深圳4城市就接受了人事部抽查的15个省市10.9%的高校毕业生。北京地区和东南沿海地区至少吸纳了全国高校一半的大学毕业生。而各高校的毕业生也基本上都将自己日后的就业流向定位在东部发达地区,比如,北京、浙江、广东等地。我国大学毕业生就业存在显著的地区差异。4.2问题的统计 数据抽样利用EXCEL软件的“自动筛选”命令,从全体的数据中选出较有代表性的八座城市作为样本。假设这些城市的统计结果及其比较基本上可以代表毕业生就业与该区域经济发展水平之间的关系。 指
23、标计算利用EXCEL软件的函数命令,分别计算样本中各城市大学毕业生的就业率。(具体计算结果见附件表格) 结果分析就业率是对毕业生就业情况的综合评价。由统计数据做出下图:不同地区毕业生就业率0.750.80.850.90.951上海宁波合肥济南北京深圳大连苏州城市、地区就业率值就业率 图4 不同地区大学毕业生就业率从上图的统计中可以看出,东部沿海城市就业率普遍较高。城市对就业率影响作用主要体现在以下几个方面:首先,区域经济发展水平决定当地教育的规模和发展速度。高的教学质量可以培养出更多人才,称为地区发展的主力军。其次,经济发达地区对毕业生的需求量大。反之,经济发展速度较慢的地区,本身对人才吸纳的
24、能力有限,就业就相对而言比较困难。最后,东部地区的优势资源吸引大学毕业生们前往就职。综合以上因素,区域经济发展水平与该地大学毕业生就业情况呈正相关的关系。(五)问题5:有关我校毕业生就业的意见中央民族大学从1943年建校至今,经过半个多世纪的建设和发展,已经成为学科门类比较齐全的综合性重点大学。学校为国家输送了大批各民族毕业生,他们大多数已成为民族地区各条战线的骨干。学校的民族学、中国少数民族语言文学等学科具有雄厚的实力和特色优势,不仅在全国居于领先地位,而且具有较大的国际影响。民族史、宗教学、中国少数民族经济、民族理论与民族政策、中国少数民族艺术、语言学及应用语言学、生态学等学科也得到快速发
25、展。我校毕业生在国家相关就业方针和政策指导下实行“双向选择、自主择业”的就业制度。文学与新闻传播学院、外国语学院、舞蹈学院、数学与计算机科学学院、物理与电子工程学院、教育学院等应用型专业就业率均高于90%,民族学、历史学等特色学科优势明显,毕业生考研率高。毕业生就业主要面向中央、国家和地方各级机关、高等院校和科研院所、企事业单位及部队,就业行业包括信息电子、文化传播、财经、金融、政法、教育、体育、艺术等各领域。但是事实上,近几年全国高校毕业生人数增长较快,就业形势十分严峻,依然存在着许多刻不容缓的问题。1 毕业生人数剧增造成就业压力大。1999年开始,我国高校开始全面“扩招”,高等教育开始由“
26、精英教育”向“大众教育”转化。数据显示,全国高校毕业生2002年至2006年分别为145万,212万,245万、338万、430万。数字表明,毕业生就业形势很严峻,对工作人员有非常大的压力。2 供需矛盾突出。近几年,毕业生就业渠道吸纳能力逐渐下降,人员饱和。学校、政府机关、事业单位等传统的就业渠道在大量精简、分流,已经是人满为患,无法再接受更多的毕业生,使毕业生进入行政机关的机会减少,并且,裁减的行政机关人员要和毕业生一同进入市场竞争再就业,因此接纳毕业生的容量相当有限; 3 毕业生自身存在的一些问题与社会需求存在着一定的差距,加重了毕业生就业的难度。一是就业期望值过高,非中心城市不去,非工资
27、待遇好的单位不去,非机关政府不去;二是学生的实际专业知识、技能水平与用人单位的要求有一定的距离;三是就业观念保守、陈旧,还适应不了改革后的就业方式;四是积极响应国家“先就业、再择业、后创业”政策的毕业生还不多。4 用人单位选要毕业生的要求越来越高。许多基础教育单位开始要研究生甚至是博士,做基础技能工作要求过外语六级、八级水平,出现了研究生与本科生竞争,以及不符合本单位实际要求的现象。如何解决就业困难的问题?从网上调查到的资料显示,六成同学能够更多地从自身出发努力应对就业难的问题,值得鼓励。另外四成同学希望多提供实习基地和就业单位,或多举办职业培训和讲座。这就给学校提出了繁重的任务,那就是如何更
28、广泛地开辟和建立实习基地,把实习与就业结合起来,如何有针对性地组织和安排较为系统的职业培训和指导。大学生的就业指导应当从大一抓起,工作重心不能单纯放在大四的就业率上,而应该放在培养大学生的危机意识和职业意识这个根本上。对于月薪的追求上,同学们应该有个清醒的认识。据调查统计,现在本科大学生的一般月薪平均水平在10002000之间。而能有这种客观认识的学生,只有16%。当然学生选择高薪也无可厚非,但是随着高等教育大众化的实现,学生们应该认识到大学生是普通劳动者,如果用大众化的高等教育去要求精英教育的回报,势必产生心理失衡。精英是从工作实践中走出来的,而非四年大学教育培养出来的。专业对口是否非常重要
29、?答案是肯定的,但比较理想化。在目前来看,由于大学(尤其是本科)课程设置和教师素质等原因,毕业生的书本知识与社会实践需求往往对接不上;而且,大学四年也不可能完美地做到系统地、完善地、详细地掌握某个科学知识,更何况书本上的知识有老化的部分;再加上用人单位更强调个人综合素质和发展潜力,专业不对口也可被录用。所以说,大学毕业后专业不对口是普遍的,仅仅对口也不一定录用你。能否融入社会,主要看你的悟性和综合素质。一味强调专业对口,往往会失去就业的机会。 许多同学在择业时认为一个单位的所有制很在重要。但是其实一个单位的优劣,不能以所有制来判断。一般而言,运行机制灵活,用人制度先进,有良好的成长前景,有利于
30、员工成长的企业才能算是有发展的企业。国有企业与其他企业相比孰好孰差,不能以所有制形式来衡量。很多学生认为单位所有制重要和非常重要,这说明毕业生还残留着计划经济时代的就业观念。当然,这与我们整个社会的就业惯性有关系,也与社会就业保障制度不健全甚至缺失有关系,同时也说明毕业生就业意识存在幼稚的成分:国有的、公有制的才是体面的工作。这也更暴露出学生就业受家庭和社会的影响很深,短时间内是无法改变的,就业的盲目性和跟风效应还会存在下去。这就需要学校引导学生解放思想,与时俱进,跟上时代前进的步伐,转变就业观念,端正择业态度。是否有同学认为今后打拼社会最需要、他们最缺乏的、也是社会最急需的是外语水平、计算机
31、运用和专业水平?殊不知,外语和电脑是大路学问,是任何一个学生都早已基本准备好了的工具,他们既不是当代大学生最缺乏的,也不是当今社会最需要的。当今社会最需要的、最看重的是一个人的综合素质。而综合素质,恰恰是当代大学生普遍缺失的。为什么会有这么大的认识差距呢?这就应该从大学教育之中寻找原因了。至于专业水平的深浅与否,也不是用人单位对本科大学生最为强调的,他们看重的是一个大学生的适应能力和发展潜力。同学们感到专业水平缺乏,反映了他们对大学四年“什么都学了,什么都没学到”的焦虑和无奈,心理有一种失落感,这也需要大学从课程设置和讲授质量中去寻找原因。再者,就业指导服务工作不仅是就业职能部门的责任,也是已
32、经毕业的往届毕业生(校友)的义务。校友是学校的无形资产,具有示范和榜样作用,一是可以使用人单位提前了解学院的毕业生;二是可以通过校友的中介作用,为毕业生与用人单位之间架起就业桥梁,为毕业生就业提供方便;三是可以专门邀请校友所在的单位来校招聘,为毕业生拓宽就业渠道。我校建校半个多世纪以来,走到工作岗位的毕业生已是万人以上,而且大部分已在自己的工作岗位上已具有很大的成就,因此,这是一个无形的毕业生市场,我们要充分利用好。四、参考文献1(美)达莫达尔著(张涛等译):计量经济学精要(第二版),M,北京,机械工业出版社,2006年版。(177-182页)2 湖北省大学生数学建模竞赛专家组组编:数学建模(本科册),M,湖北:华中科技大学出版社,2006年版。(293-298页)3 冯杰,黄立伟等编著:数学建模原理与案例,M,北京,科学出版社,2007年版。(139-158页)4 王纯国等著:大学生就业指南,M,北京,2005年版。5 张志涌等编:MATLAB教程,M,北京,北京航空航天大学出版社,2006年版。6 刘来福、曾文艺编:数学模型与数学建模,M,北京,北京师范大学出版社,1997年版。五、附录1MATLAB操作示意图(一)2MATLAB操作示意图(二)3MATLAB操作示意图(三)1MATLAB操作示意图(一)MATLAB操作示意图(二)MATLAB操作示意图(三)