Machine Learning

군집화 (Clustering )

판교데싸 2020. 12. 28. 15:36

* 군집화 : 하나 이상의 특징을 바탕으로 유사한 샘플을 하나의 그룹으로 묶는 작업 

- 군집화의 목적

 

* 군집화의 필수 개념 - 거리와 유사도는 완벽하게 반대 개념

* 유사도 척도 

1. 유클리디안 거리

 

 

2. 맨하탄 거리 (리커트 척도란 설문조사 같은 데이터를 말함,ex)매우만족,만족,불 만족 )

 

 

3. 코사인 유사도

 

 

4. 매칭유사도 (이진형 데이터만 사용)

 

 

5. 자카드 유사도(희소한 이진형 데이터에 자주 사용)

반응형

'Machine Learning' 카테고리의 다른 글

빈발 패턴 탐색  (0) 2021.01.01
계층적 군집화  (0) 2020.12.28
Permutation Feature Importance  (0) 2020.12.15
Featrue Importance(변수 중요도) - 트리 기반 모델  (0) 2020.12.15
Interpretable Machine learning  (0) 2020.12.14
반응형