목차
반응형
- 서포트 벡터 머신 : 데이터 분포를 나누는 지도 학습의 분류에 해당하는 모델
서포트 벡터 머신 알고리즘은 2차원뿐만 아니라 다차원의 벡터 공간을 2개로 잘 나눌 수 있는 경계를 찾기위한 알고리즘이다. 경계가 데이터들과 가장 멀리 떨어져 있어야 가장 적절한 경계다. 최적의 경계는 Maximum margin을 가진다.
- 마진(margin) : 경계와 서포트 벡터 사이의 거리
- 두 개의 데이터를 구분하는 경계에 위치하는 데이터 포인트를 서포트 벡터라고 한다.
- 마진의 값이 클 수록 최적의 경계로 분류한 것이다. 또한, 서포트 벡터 머신은 커널함수를 사용해 선형으로 분류할 수 없는 데이터를 분류할 수 있고 2차원의 데이터를 다차원으로 가져가서 분류할 수 있다.
*서포트 벡터 머신의 동작 원리
어떻게 두 개의 그룹으로 나눌 것인가? -> 직선으로 나눈다. -> 가장 균형있는 직선으로 나누는 방법은?
-> 최대 마진을 가지는 직선으로 나눈다.
참고자료
책 : 실무가 훤히 보이는 머신러닝&딥러닝
반응형
'Study > 머신러닝' 카테고리의 다른 글
[4] MLP(Multi Layer Perceptron)로 텍스트 분류하기 (0) | 2020.07.30 |
---|---|
[3] 나이브 베이즈 분류를 사용한 텍스트 분류 (0) | 2020.07.25 |
[2-2] Word2Vec을 활용해 문장을 벡터로 변환하기 (0) | 2020.07.17 |
[2-1] KoNLPy 사용해서 한국어 형태소 분석하기(자연어 처리) (0) | 2020.07.16 |
[1-1] 의사 결정 나무 (0) | 2020.07.10 |