목록ML & DL (42)
머신러닝을 할 때 아래 3가지 요소를 잘 정의해야 한다. Task: 내가 풀고자 하는 task는 무엇인가? Experience: 내가 가지고 있는 data는 무엇이고 이 data가 해당 task를 잘 설명하고 있는지, 충분한 data가 있는지 Performance measure: 머신러닝의 성능지표를 어떤 기준으로 두고 평가할 것인지 머신러닝의 학습 알고리즘은 크게 supervised learning과 unspervised learning 두가지로 나눌 수 있다. (그 외의 강화학습, 추천시스템 등이 있음.) Supervised Learning: 정확한 답이 있는 dataset을 주고 학습시키는 방법 - Classification: 이산적인 결과값을 예측할 수 있는 함수(모델)을 찾아 새로운 데이터에 대..
이 글을 쓰는 이유는 Keras를 통해 CNN을 직접 구현해보고 이미지 classification에서 자주 사용되는 데이터셋이 아닌 다른 데이터셋을 사용하여 classification을 해보는 것이 주 목적이다. 딥러닝 라이브러리를 통해 데이터셋을 바로 불러오는 게 아니라 직접 로컬 데이터를 불러와보고 전처리도 해보고 네트워크를 설계하고 하이퍼 파라미터를 조절해보며 겪게 될 시행착오를 남기고자 한다. 상대적으로 구조가 간단한 vgg16으로 시작하여 네트워크를 만들어보고 직접 트레이닝할 것이다. 이후 Imagenet dataset으로 pre-train된 네트워크와 비교해보고 다른 네트워크 역시 만들어볼 것이다. Dataset데이터셋은 캐글에 올라온 Blood cell dataset을 사용하였다. (문제시 ..