İnsan Kaynaklarında ne kadar fazla veri olduğundan ve bu verinin zenginliğinden önceki yazılarımızda oldukça fazla söz ettik. İK’da Makine Öğrenmesi de işte elindeki bu verilerden tahmin yapmak, anlam çıkarmak anlamına geliyor. Gözetimli Makine Öğrenmesinin, Makine Öğrenmesinden farkı Label ve Feature‘lar ile prediction-tahminleme yapmaktan geçiyor. Buna örnek olarak, hemen her sitede ortaya çıkan ürün öneri sistemlerini veya Churn Analysis – Ayrılma analizi tahminlerini verebiliriz. Gözetimli İK Makine Öğrenmesi örneği olarak en sık karşılaşılan vaka, hangi çalışanın şirketten ayrılacağının tahminidir.
İş Zekası’nda olduğu gibi, bu tip bir ayrılan analizi için önce Dimension – Boyutlar belirlenmeli, ardından da Fact – Gerçekleşen belirlenmelidir. Basit bir İK Makine Öğrenmesi için, Feature’lar çalışan yaşı, ev iş arası uzaklık, cinsiyet, kıdem, pozisyon kıdemi, terfi edip etmediği, performans skoru gibi veriler olabilir. Fact – Gerçekleşen kısmında ise satır bazlı olarak bu boyutlara sahip çalışanın ayrılıp ayrılmadığı yer alır. İşte buna İnsan Kaynaklarında gözetimli makine öğrenmesi diyoruz.
Tabi İK Makine Öğrenmesi Eğitimi’mizde bunları çok daha detaylı örnekler üzerinden anlatıyoruz(www.bncturkey.com veya iletişim kısmından eğitim detaylarını edinebilirsiniz).
Feature ve Label kavramlarından sonra, etiketlediğiniz datanızı bir Makine öğrenmesi aracı ile çıktıya dönüştürmeniz gerekiyor. Ancak elinizde bir hr veri seti varsa, bunun hepsini makine öğrenmesi algoritmasını eğitmek için kullanmamak gerekiyor. Genel kabul %70’ini training set; %30’unu da test set olarak kullanmak yönündedir. Yani algoritmanızı verinizin %70’i ile eğitecek, %30’u ile de test edeceksiniz. Böylece yaptığınız modelin, veri setinizde ne kadar doğru tahminler çıkardığını tahmin edebileceksiniz. Test verilerinde bakacağınız sonuç ise False/Positive’lerin sayısının düşük olmasıdır. Yani bu modelin yanlış yapma olasılığının düşük olduğu modeli seçmelisiniz.
Gözetimsiz Makine Öğrenmesi ise veri setinde sadece Features’lar olduğu zaman kullanılır. Veri setinizde 12 üçgen, 9 kare, 5 tane de yuvarlak şekil olduğunu düşünün. Bunları bir algoritma yardımı ile üçgenler, kareler ve yuvarlaklar olarak gruplarsanız (Clustering Algoritması) alın size Gözetimsiz Makine Öğrenmesi!
Bu basit örnek paralelinde, İnsan Kaynaklarında Gözetimsiz Makine Öğrenmesi örneği düşünelim. İlk olarak feature’ları bulmamız gerekiyor. Örneğin işte iyi performans gösterenler grubu ve özellikleri belirlenmeli. Ardından kötü performans gösterenlerin özellikleri bulunmalı (feature’ları belirlenmeli). Sonunda ise Clustering algoritmasına kaç cluster olduğunu bizim söylememiz gerekiyor. Örneğin aşağıdaki tabloda sizce kaç cluster vardır?
Renklendirmeden de görüleceği üzere bu veri setinde iki cluster gözüküyor. Algoritma seçimi sırasında datamıza bakıp kaç clustera böleceğini bizim söylememiz gerekiyor.
Temel bir giriş yapıp, İK Makine Öğrenmesi ile ilgili bir kaç örnek verdiğimiz bu yazımızdan sonra NLP, Text Mining, Network Analysis gibi niş konuları bulacağınız bir yazımızı planlıyoruz.
Bir cevapla değil, ama bir kaç soru ile bitilerim. Lakin en faydalı şeyler cevaplardan çok sorular oluyor. IOT, Machine Learning ve Deep Learning farklarını öğrenmek ister misiniz? Makine Öğrenmesinde datanız text ise nasıl bir çözüm yolu bulabilirsiniz? Makine Öğenmesi Time Series forecast’lerinde Seasonality nedir? IOT (Nesnelerin İnterneti) insan kaynaklarına mümkün mü?
Daha fazla soru ve cevapları için güzel bir kompozisyon olan “Bnc Insight” sitesine tıklayarak uğramanızı öneriyoruz.
Merak edeceğiniz bir yıl olması dileğiyle.