3-3 Multiclass Classification 본문

ML & DL/Coursera-ML

3-3 Multiclass Classification

eremo2002 2019. 1. 10. 10:49

로지스틱 회귀를 이용하여 Multi-class classification 문제를 푸는 방법을 아본다.













멀티클래스 분류는 클래스가 여러 개인 문제를 분류하는 것이다.

이메일을 종류별로 분류하는 환자를 진단하는 그리고 날씨를 4개의 경우 하나로 분류하는 등이 있다.

Y 클래스 값을 0으로 시작하든 1 시작하든 상관 없다.










Binary classification에서 이렇게 직선을 그어 클래스를 구분하였다.

멀티클래스 분류에서도 이와 같은 방법을 이용한다.











3개의 클래스를 가지는 데이터셋을 분류하기 위해 문제를 binary classification 문제로 전환할 것이다.












먼저 삼각형 class1 양성이라 하고 나머지 데이터는 모두 음성으로 취급한다.

그러면 오른쪽 위의 그림처럼 binary classification으로 바꿔서 생각할 있다. 이제 하나의 직선을 그어 class 1 것과 아닌 것으로 구분할 있다.

마찬가지로 class2 class3에서도 동일한 방법을 사용한다. 따라서 케이스마다 h(x) 존재하기 때문에 3개의 가설 h(x) 나오게 되며 파라미터 θ에대한 입력 데이터 x 주어졌을 데이터가 클래스로 분류될 확률을 구할 있다. 여기서 첨자는 해당 클래스를 나타낸다.










이렇게 구한 3개의 h(x) 클래스 i 대해 입력 데이터의 클래스 y i 예측할 확률이 된다.

따라서 3개의 결과값을 비교하여 x 가장 높은 확률을 출력한 클래스에 속할 것이라고 분류할 있다.

멀티클래스 분류는 이렇게 간단한 방법을 사용하여 우리가 앞에서 배웠던 로지스틱 회귀를 그대로 적용하여 있다.




















'ML & DL > Coursera-ML' 카테고리의 다른 글

4-1 Neural Networks Motivation  (0) 2019.01.15
3-4 Solving the Problem of Overffiting  (0) 2019.01.11
3-2 Logistic Regression Model  (0) 2019.01.09
3-1 Classification and Representation  (0) 2019.01.09
2-2 Computing Parameters Analytically  (0) 2019.01.08
Comments