overfitting - train 데이터가 실제 부딪힐 수 있는 모든 상황의 데이터를 갖지 못해 발생 Augmentation : 기존의 이미지 데이터를 조금 변형시키는 것 - train 데이터에 약간의 변형을 가해, 데이터의 분포를 다양하게 만든다. ImageDataGenerator 객체 생성 - Image Data Augmentation을 위한 다양한 설정정보 지정 - rotation_range : 랜덤하게 사진을 회전시킬 각도 범위 - width_shift_range/height_shift_range : 사진을 수평과 수직으로 랜덤하게 평행 이동시킬 범위 - shear_range : 랜덤하게 전단 변환을 적용할 각도 범위 - zoom_range : 랜덤하게 사진을 확대할 범위 - horizontal..
기존에는 numpy 형태로 이미 처리된 이미지 데이터를 사용했기 때문에, 파일 형태의 이미지 데이터을 분석하는 실무 적용에는 한계가 있었다. 이번 시간에는 ImageDataGenerator API를 이용하여 이미지 파일을 load하여 전처리 작업 후 모델의 학습에 사용하는 실습을 진행한다. - CNN 모델을 이용하여 분류 분석 모델을 만든다. - 앞선 Cat&Dog 데이터 셋(2개의 클래스)과 다르게 3개의 클래스로 구성되어 있다. - 구글 AI 팀의 연구원 Laurence Moroney 이 딥러닝 교육용으로 수집한 데이터 셋 - 3000여 장의 300x300 픽셀의 24bit 컬러로 구성되어 있는 데이터셋 import tensorflow as tf from tensorflow import keras i..
* 여태까지는 tensor 형태의 잘 정제된 데이터를 사용했지만, 실무에서는 jpg와 png 같이 정제되지 않은 바이너리 데이터를 사용해야한다. 이렇게 이미지 파일을 읽어서 텐서 객체로 바꿔서 모델에게 전달하는 과정을 데이터 파이프라이닝이라고 한다. 이를 편리하게 할 수 있게 keras에서 지원하는 api가 imagedatagenerator이다. from tensorflow import keras import os 1. Cats and Dogs 데이터셋 다운로드 url = 'https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip' keras.utils.get_file(fname='cats_and_dogs_filtered.zip',..
- 캐나다 토론토 대학의 연구팀에서 mnist보다 좀 더 복잡한 이미지 연구를 위해 수집한 데이터 셋 - 60,000개의 컬러 이미지로 구성된 이미지 데이터 입니다. - 100개의 클래스를 가지고 있고 각 클래스는 600장의 이미지 데이터로 구성되어 있습니다. - 각각의 이미지는 (32, 32, 3) 형태의 3차원 텐서로 구성되어 있다. - CIFAR-10-codepresso 데이터 셋은 CIFAR-100 데이터 셋에서 10 개의 클래스를 선택하여 데이터 셋을 구성하였습니다. 또한 각 클래스의 라벨 정보는0~9 사이의 정수로 구성되어 있습니다. - 각각의 범주 id 와 인덱스로 매핑 되어 있는 class name 리스트 자료 구조는 아래와 같습니다. cifar_label_name = ['apple', '..