Project & Kaggle

사내 직원 이탈 모델링

판교데싸 2020. 9. 4. 23:11

0.1  사내 직원 이탈률에 대한 Churn management 분석

 

이번 캐글 주제는 사내 직원들이 기업을 떠나는 패턴을 파악해 Churn rate를 예측하는 것

import pandas as pd
df=pd.read_csv(r"C:\Users\robin\Desktop\캐글데이터\churn.csv")

 

 

 

#대략적인 데이터는 이렇다.

# 결측치는 없는 것으로 확인

# 성별을 label encoding으로 수치화

# 다른 범주형 변수들도 label encoding 시각화 한다

# 원핫 인코딩

범주형 변수를 모두 원핫 인코딩 해준다. 그중 num of frequency 는 -> frequent encoding

 

# 이후 수치형 데이터들의 heat map 을 살펴서 상관 관계를 확인

# y=churn 으로 잡고  트레인 테스트를 나눈다.

알고리즘은 Randomforest로 설정한 후에 각각의 Accuracy 를 확인한다.

반응형
반응형