Machine Learning

AUC-ROC 심화 이해

robin0309 2020. 8. 30. 16:11

AUC-ROC 곡선이란?

 

1. AUC-ROC 곡선은 다양한 임계 값 설정에서 분류 문제에 대한 성능 측정

2. ROC 곡선은 TPR이 y 축에 있고 FPR이 x 축에있는 FPR에 대한 TPR 값을 Plotting 한 것

 

모델의 성능 측정 방법

*우수한 모델은 AUC가 1에 가까워 분리 성이 우수,불량 모델은 AUC가 0에 가까워서 분리성이 낮음

1. 이상적 상황 -> 두 곡선이 겹치지 않아 이상적 분리 가능성 측정.

2. 두 분포가 겹치는 경우 유형 1 및 유형 2 오류가 발생

-> Cutoff 값을 통해 최소화하거나 최대화 할 수있음

ex)AUC가 0.7이면 모델이 포지티브 클래스와 네거티브 클래스를 구분할 수있는 확률이 70 %

 

3. AUC가 약 0.5 인 경우 모델은 positive 클래스와 negative 클래스를 구분할 수있는 식별 능력이 없음

* 민감도, 특이도의 관계

Sensitivity⬆️, Specificity⬇️  /////  Sensitivity⬇️, Specificity⬆️

1. Cutoff를  줄이면 더 많은 양의 값을 얻으므로 민감도가 증가하고 특이도가 감소

2. Cutoff를 늘리면 더 많은 음수 값을 얻게되므로 특이성이 높아지고 민감도가 낮아집니다.

반응형
반응형