k-평균 클러스터링(k-mean Clustering)그룹 중심까지의 거리를 최소화하도록 다변량 데이터를 상대적으로 적은 수의 그룹으로 분류하는 비지도 기법이다.말이 너무 어렵다. 간단하게 데이터를 k개의 클러스터로 묶는 알고리즘이다.알고리즘 설명데이터 공간에서 임의의 k개의 중심점을 설정한다.각 데이터와 설정한 중심 사이의 유클리드 거리를 계산한다.계산한 값을 바탕으로 가장 가까운 중심의 그룹에 할당한다.k개의 중심점을 해당 중심점에 할당된 모든 데이터의 평균으로 갱신한다.수렴 기준을 만족할 때까지 또는 N회까지 2~4단계를 반복한다.유클리드 거리유클리드 거리 $d_{i,j}$는 데이터 관측치 $i$에서 중심 $j$까지의 거리를 나타낸다.$d_{i,j}=\sqrt{(x_i-x_j)^2+(y_i-y_j)^..