* 특정 그림에 개와 고양이가 포함되어 있는지 분류하는 kaggle 과제
* 전체적인 EDA 및 모델링 목차는 이렇다
1. 먼저 parameter를 정의하고 그림 file을 확인한다
2. 이후에 Training data 및 데이터를 담을 리스트를 만든다
3. 랜덤한 샘플 이미지는 이렇다
4. 이후 CNN 모델을 정의한다.
* 위의 모델 layer 가 이런식으로 구성 되어있다고 생각하면 된다
5. 과적합을 방지하고 최상의 accuracy 지점을 찾기위해 callback 을 정의한다
* Image data generator 사용하는 이유
-> 기본적으로는 이미지데이터 학습을 쉽게 하기 위해서인데
ImageDataGenerator 클래스를 통해 객체를 생성할 때 파라미터를 전달해주는 것으로 데이터의 전처리를 쉽게해주고
flow_from_directory 메소드를 활용하면 폴더 형태로된 데이터 구조를 바로 가져와서 사용가능하고 labeling도 해줌
3months.tistory.com/199 -> 참고
6. 모델 성능을 높이기 위해 값을 신경망 모형에 맞는 -1~1사이로 지정하고 데이터를 부풀린다.
7. validation은 generator에서 rescale 만 진행한다 ( 단순히 검증용 이므로)
8. 다양한 parameter를 지정하고 Model을 fitting 시킨다.
9. model 과 optimizer도 함께 저장 해두면 나중에 다시 이어서 학습하기 용이하고
Weight만 저장하여 Transfer Learning 에도 적용 가능
10. accuracy와 val_accuracy를 시각화 하며 과적합이 시작되는 구간을 체크한다.
11. 예측값을 받아본다 (Predict)
12. Sample Test -> 괄호 안이 labeling
'Project & Kaggle' 카테고리의 다른 글
학생들의 수업 시간 행동 분석을 통한 성적 예측 (0) | 2021.02.02 |
---|---|
심부전증 환자 데이터를 통한 사망 여부 Classification (0) | 2021.02.01 |
주택 가격 예측 with Deep Neural network (0) | 2020.12.11 |
Deep learning( CNN을 활용한 Mnist classification kernel) (0) | 2020.11.30 |
사내 직원 이탈 모델링 (2) | 2020.09.04 |