📖 WIPIVERSE

🔍 현재 등록된 정보: 14,880건

KNN

K-Nearest Neighbors (KNN)은 지도 학습(Supervised Learning) 알고리즘 중 하나로, 분류(Classification)와 회귀(Regression) 모두에 사용될 수 있다. 새로운 데이터 포인트의 클래스 또는 값을 예측하기 위해 기존 데이터 포인트들 중 가장 가까운 K개의 이웃(neighbors)을 고려한다. 즉, 새로운 데이터 포인트와 가장 유사한 K개의 데이터 포인트의 클래스(분류) 또는 값(회귀)을 기반으로 예측을 수행한다.

알고리즘 동작 방식

  1. 거리 계산: 새로운 데이터 포인트와 기존 데이터 포인트들 사이의 거리를 계산한다. 일반적으로 유클리드 거리(Euclidean distance)가 사용되지만, 맨하탄 거리(Manhattan distance)나 민코프스키 거리(Minkowski distance) 등 다른 거리 측정 방식도 사용 가능하다.

  2. K개 이웃 선택: 계산된 거리에 따라 가장 가까운 K개의 이웃을 선택한다. K값은 사용자가 지정하는 매개변수이며, 알고리즘의 성능에 영향을 미친다.

  3. 예측:

    • 분류: K개의 이웃 중 가장 많은 클래스를 새로운 데이터 포인트의 클래스로 예측한다. 동점이 있을 경우, 다양한 방법(예: 무작위 선택, 가중치 부여)을 사용하여 클래스를 결정한다.
    • 회귀: K개의 이웃의 값들의 평균 또는 중앙값을 새로운 데이터 포인트의 값으로 예측한다.

장점

단점

매개변수

응용 분야

KNN은 패턴 인식, 이미지 분류, 추천 시스템 등 다양한 분야에서 활용된다.