1. K-means Clustering -> 유사한 데이터 끼리 뭉치게 해서 그룹의 특성을 규명하는 것이 주목적이지 classification의 목적은 강하지 않음 -> k를 설정 초기 좌표는 Random 해당 데이터가 다른데이터로 할당 되지않을 때까지 계속 진행 -> 직관적인 장점 *거리 측정 기준 * 가장 좋은예시는 사전의 군집갯수(K)를 알고 시작하는것 ex) 기사 -정치,연예,스포츠 하지만 보통의 경우에는 사전 군집갯수를 알 수 없음 inertia -> 군집내 분산이 적어지는 시점이 최적의 K k-means clustering 단점 -> 데이터의 차원이 커질 수록 잘 맞지않음 . 2차원 3차원 까지는 알 수 있지만 4차원 부터는 거리에 대한 개념이 무감각해짐(컴퓨터도) 물론 구할 수는 있지만 실제..