本文摘要:摘要:人力資源是企業發展的重要資源,做好員工離職預警工作有助于企業長遠發展。本文采用國網青海省電力公司20102018年的員工離職數據,分析得出人才流失的主要影響因素,使用支持向量機(SVM)算法進行員工離職預測分析。該預警模型使用部分員工數據作為訓練
摘要:人力資源是企業發展的重要資源,做好員工離職預警工作有助于企業長遠發展。本文采用國網青海省電力公司2010—2018年的員工離職數據,分析得出人才流失的主要影響因素,使用支持向量機(SVM)算法進行員工離職預測分析。該預警模型使用部分員工數據作為訓練集,其余作為測試集,使用精確度為92.7%的中值高斯核函數型支持向量機(MediumGaussianSVM)進行預測,模型預測精度符合預期,為電網企業人才流失預警提供了有效的方法。
關鍵詞:人才流失SVM離職預警模型
經濟論文投稿刊物:商業經濟是黑龍江省商務廳主管,黑龍江省商業經濟學會和黑龍江省商業經濟研究所主辦,商業經濟編輯部編輯出版的經濟類綜合期刊。本刊注重期刊的標準化、國際化和現代化建設。為豐富本刊刊發內容,進一步提高期刊質量及可讀性,擴大本刊影響力,現正在面向社會各界誠征優秀稿件。
人才流失是電力企業亟需解決的一個重要問題,因而員工離職預警研究受到了國內外企業界與學術界重點關注。要想降低員工離職帶來的人才流失風險,建立有效的員工離職預警機制已成為現代企業管理者必須面對的重大問題。目前,學者們較多采用模糊綜合評價方法、專家評價方法等手段進行員工離職預警研究。盡管這些方法具有計算簡便、易于理解和操作的特點,但由于這些方法涉及大量的具有較強非線性和模糊性特征的定性指標,且無法有效地預警大數據時代員工離職情況,而將支持向量機優良特性應用于員工離職預警,可以有效解決這一問題。
1員工離職影響因素分析
本文采集了國網青海省電力公司2010—2018年共2665名入職員工工作單位類型、籍貫區域類型、年齡、學歷、崗位等數據進行分析。從性別離職員工分析,每年的離職人員中男性比例均大于女性比例,可以看出性別是離職的影響因素。從離職人員年齡分析,離職人員呈鐘形左偏態分布,年齡主要分布在20~34歲,且在25歲達到峰值,23~26歲離職人員占全部人員的58.69%。員工離職呈現年輕化。從婚姻狀況分析,離職人員中未婚人群是主要的群體,其中97.37%的女性為未婚,93.14%的男性為未婚。從工作年限進行分析,工作2年離職的人數占23%,1年的人數占18%,人員穩定性較差。從離職員工生源地分析,離職人員的生源地主要分布在西部城市,占比55.40%,因此生源地是重要影響因素。從離職人員學校類別分析,211離職人員最多為88人,占211院校8年入職人數的8.57%,985離職人數26人,但是占985入職人員的10.57%,而專科院校是離職人數占相應入職人數最少的院校,為4.84%。
從最高學歷分析可得,大學本科畢業174人占離職總人數的81.69%,且占相應入職人員的8.5%,碩士研究生12人占相應入職人員的7.4%,大學?飘厴I24人占相應入職人數的5.28%。如此可見,學歷相對較低的人員其工作較為穩定,本質原因為其可選擇的機會較少;而部分離職人員入職時間較短,且學歷為大學本科及以上。說明其對工作環境、工作待遇、工作前景較為不滿,對于此類員工,公司要更加重視其需求,爭取降低該類員工的離職率。從離職人員單位名稱分析,檢修公司離職人員最多44人,再是海西供電公司22人,離職人員數量占入職該單位人員數量超過10%。從工作地點艱苦程度來看,四類離職人數最多98人,占入職相應人員的12.53%,條件艱苦地區離職率較高。基于以上分析,本文選取了工作單位類型、籍貫區域類型、崗位、學校類型、生源地、性別、婚姻狀況、專業、工作地區艱苦級別9個指標構建員工離職預警模型。
2模型選取及應用
2.1SVM的概念
支持向量機(SupportVectorMachine,SVM)是一種從線性可分數據的“最優分類面”求解方法發展而來、基于結構風險最小化原理(StructureRiskMinimization,SRM)的機器學習方法。由于其出色的學習性能和巨大的應用潛能,支持向量機成為機器學習界備受青睞的方法,在人事管理、項目評估、風險預測等多種領域大放異彩。
2.2SVM預測原理
2.2.1線性可分數據的最優分類面
在原始數據空間中,若存在一個能夠無錯誤地把數據集分成兩類的線性函數,則稱該數據線性可分,對于二維數據,定義兩條過距離分類最近的數據點且平行于數據線的直線之間的距離為分類間隔。線性可分的最優分類面問題要求取得的線性函數不僅要能正確地將兩類點分開,而且能使分類間隔最大,推廣到高維空間,最優分類面就成為最優超平面。
2.3計算過程及結果
2.3.1數據預處理
因指標均為離散變量且選項固定,不存在主觀影響,故只需遵從相同的賦值規律進行選項數字化和數據標準化,支持向量機就可以在訓練中正確衡量各個參數對員工離職現象的影響力,部分數據賦值結果。本文隨機抽取2000組數據,作為我們的支持向量機器訓練集,余下665組數據作為測試集。
2.3.2核函數的選擇
使用Matlab2018a軟件進行支持向量機建模,由支持向量機的原理可知,核函數的選擇直接決定了輸入空間數據能否轉化為屬性空間內的線性可分數據,針對本文數據,我們計劃通過對比分析,選取更合適的核函數。我們選取的核函數及各個核函數下的支持向量機模型在十次交叉驗證情況下。由此可知,使用SVM模型進行訓練的精確度均較高(90%以上),其中以MediumGaussianSVM為最高,故我們選取MediumGaussian核函數進行預測集的檢驗。
2.3.3訓練和測試結果
使用余下665組數據作為預測集,預測結果與實際結果對比如表4所示?梢钥闯,該模型對未離職員工數量預測較為準確,預測準確度達94.04%。雖然對離職員工預測數字偏少,但由于整體數據中離職員工所占比例并不大,對未離職員工人數判斷的微小偏差即會明顯地影響離職人數預測準確率,故該預測結果合理。即以MediumGaussian為核函數的支持向量機模型可以較好地根據員工的年齡、性別、學歷、崗位、工作區域等參數評估員工離職的概率。
3結語
人才流失是電力企業亟需解決的一個重要問題,因而對員工離職預警研究是國內外企業界與學術界重點關注的話題。然而,傳統的模糊綜合評價法、專家評價法等方法無法解決大數據時代的員工離職問題。針對此問題,本文選取了SVM方法進行企業員工離職預警研究,采用國網青海省電力公司2010—2018年員工離職的共2665條數據進行實證分析。實驗結果表明,支持向量機模型可以較好地根據員工的年齡、性別、學歷、崗位、工作區域等參數評估員工離職的概率,為大數據背景下電力企業員工離職預警提供了新的思路和方法。由于條件的限制,本文僅選取國網青海電力公司一家的數據,在今后的研究中,將采取多個地區和企業的實踐數據進行研究,以擴展本文研究方法的適用性。
參考文獻
[1]李強,翟亮.基于Stacking算法的員工離職預測分析與研究[J].重慶工商大學學報(自然科學版),2019(01).
[2]祖鵬.餐飲業員工人格特質與離職意向的關系研究[J].商業經濟,2018(10).
[3]蔣明華,帥建華.知識型員工離職意愿消減行為研究——基于多變量視角下的模型構建與實證研究[J].技術經濟與管理研究,2018(01).
[4]趙慧軍,席燕平.情緒勞動與員工離職意愿——情緒耗竭與組織支持感的作用[J].經濟與管理研究,2017(02).
轉載請注明來自發表學術論文網:http://www.zpfmc.com/jjlw/22117.html