Bite Bits/Data Science

분류 - 서포트 벡터 머신 (SVM)

상영 2017. 4. 17. 16:28

SVM (support vector machine)은 최근까지 가장 보편적으로 사용됐던 분류를 위한 머신러닝 모델이다. 지도학습 모델로서 주로 다루고자 하는 데이터가 2개의 그룹으로 분류될 때 사용한다. 예를 들면, 어느 마을에서 신문 A를 구독하는 가구와 그렇지 않은 가구가 있을 때 새로 이사온 사람이 신문 A를 구독할 경우를 예측하는 모델이다.


SVM은 이름에서 말하는 바와 같이 학습 데이터가 벡터 공간에 위차한다고 생각한다. 즉, 벡터 공간은 직각 좌표계에 학습 데이터가 위치한 공간이다. (일반적으로 직교좌표계인 데카르트 좌표-Cartesian Coordinates system-를 사용한다.)

SVM은 그러한 벡터 공간에서 학습 데이터가 속한 2개의 그룹을 분류하는 선형 분리자를 찾는 기하학적 모델이다. 여기서 차원을 결정하는 요인은 데이터가 가지고 있는 특성의 수다


- 알고리즘으로 배우는 인공지능, 머신러닝, 딥러닝 입문 (김의중 지음)