0.1 사내 직원 이탈률에 대한 Churn management 분석
이번 캐글 주제는 사내 직원들이 기업을 떠나는 패턴을 파악해 Churn rate를 예측하는 것
import pandas as pd
df=pd.read_csv(r"C:\Users\robin\Desktop\캐글데이터\churn.csv")
#대략적인 데이터는 이렇다.
# 결측치는 없는 것으로 확인
# 성별을 label encoding으로 수치화
# 다른 범주형 변수들도 label encoding 시각화 한다
# 원핫 인코딩
범주형 변수를 모두 원핫 인코딩 해준다. 그중 num of frequency 는 -> frequent encoding
# 이후 수치형 데이터들의 heat map 을 살펴서 상관 관계를 확인
# y=churn 으로 잡고 트레인 테스트를 나눈다.
알고리즘은 Randomforest로 설정한 후에 각각의 Accuracy 를 확인한다.
반응형
'Project & Kaggle' 카테고리의 다른 글
Dog and cat Classification with CNN (0) | 2020.12.15 |
---|---|
주택 가격 예측 with Deep Neural network (0) | 2020.12.11 |
Deep learning( CNN을 활용한 Mnist classification kernel) (0) | 2020.11.30 |
전설의 포켓몬 Classification (0) | 2020.05.06 |
보스턴 집 값 예측 - Boston Housing price Regression (0) | 2020.04.24 |