Clustering
- 비슷한 특성을 가진 데이터들을 하나의 그룹으로 묶는 작업 • 특성의 유사도를 판단하는 기준: Distance, Connectivity, Distribution, Density, etc.
- 좋은 Clustering의 기준은?
• 같은 클러스터 내의 데이터는 서로 높은 유사도를 나타내야 함
• 다른 클러스터 간의 데이터는 서로 낮은 유사도를 나타내야 함
- DBSCAN VS. K-Means clustering
- Hierarchical clustering
댓글남기기