Nemzeti Foglalkoztatási Szolgálat – Munkanélküliek profilképének elkészítése gépi tanulással

 

 

 

Nemzeti Foglalkoztatási Szolgálat számára végzett vizsgálatban anonimizált munkanélküliek személyi rekordjait elemeztünk  gépi tanulási módszerekkel abból a célból, hogy megtudjuk, milyen demográfiai jellemzők befolyásolják azt, hogy valaki munkanélküli marad, nyugdíjba vonul vagy állást szerez.

Az alábbi demográfiai jellemzőket használtuk annak megállapítására, hogy a munkanélküliek várhatóan mennyi ideig maradtak az ellátórendszerben, ill. milyen eséllyel kerültek ki a rendszerből állásszerzés vagy nyugdíjazás miatt:

  • földrajzi elhelyezkedés (NUTS 3, azaz megye)
  • nem
  • korcsoport
  • iskolai végzettség

Előbb a demográfiai jellemzők és a munkanélküliségi státusz vektorterében  főkomponensanalízist végeztünk (az egyes dimenziók fontosságának vizsgálatára), majd a véletlen erdő becslést használtuk az adatokból képzett különböző almintákra véletlen döntési fákat illesztve.  A munkanélküliek életkorának és  iskolai végzettségének egy lineáris kombinációja bizonyult a meghatározó tényezőnek abban, hogy a különféle munkanélküliségi státuszokban eltöltött időt megbecsüljük.

The machine learning method "random forests" was used to rank the importance of variables in this regression problem in a natural way.

A”véletlen erdő”gépi  tanulási módszert használtuk, hogy  az egyes változókat természetes módon fontossági sorrendbe rendezzük.

 

English