3-3 Multiclass Classification 본문
로지스틱 회귀를 이용하여 Multi-class classification 문제를 푸는 방법을 알아본다.
멀티클래스 분류는 클래스가 여러 개인 문제를 분류하는 것이다.
이메일을 종류별로 분류하는 것 환자를 진단하는 것 그리고 날씨를 4개의 경우 중 하나로 분류하는 것 등이 있다.
Y의 클래스 값을 0으로 시작하든 1로 시작하든 상관 없다.
Binary classification에서 이렇게 직선을 그어 클래스를 구분하였다.
멀티클래스 분류에서도 이와 같은 방법을 이용한다.
3개의 클래스를 가지는 데이터셋을 분류하기 위해 이 문제를 binary classification 문제로 전환할 것이다.
먼저 삼각형 class1을 양성이라 하고 나머지 데이터는 모두 음성으로 취급한다.
그러면 오른쪽 위의 그림처럼 binary classification으로 바꿔서 생각할 수 있다. 이제 하나의 직선을 그어 class가 1인 것과 아닌 것으로 구분할 수 있다.
마찬가지로 class2와 class3에서도 동일한 방법을 사용한다. 따라서 각 케이스마다 h(x)가 존재하기 때문에 총 3개의 가설 h(x)가 나오게 되며 파라미터 θ에대한 입력 데이터 x가 주어졌을 때 이 데이터가 각 클래스로 분류될 확률을 구할 수 있다. 여기서 윗 첨자는 해당 클래스를 나타낸다.
이렇게 구한 3개의 h(x)는 각 클래스 i에 대해 입력 데이터의 클래스 y를 i로 예측할 확률이 된다.
따라서 이 3개의 결과값을 비교하여 x는 가장 높은 확률을 출력한 클래스에 속할 것이라고 분류할 수 있다.
멀티클래스 분류는 이렇게 간단한 방법을 사용하여 우리가 앞에서 배웠던 로지스틱 회귀를 그대로 적용하여 풀 수 있다.
'ML & DL > Coursera-ML' 카테고리의 다른 글
4-1 Neural Networks Motivation (0) | 2019.01.15 |
---|---|
3-4 Solving the Problem of Overffiting (0) | 2019.01.11 |
3-2 Logistic Regression Model (0) | 2019.01.09 |
3-1 Classification and Representation (0) | 2019.01.09 |
2-2 Computing Parameters Analytically (0) | 2019.01.08 |