Programming/Keras

    train, test data split

    scikit-learn 라이브러리의 train_test_split 함수를 사용하면 train data와 test data를 원하는 조건으로 쉽게 분리 가능하다. from sklearn.datasets import load_iris # 샘플 데이터 로딩 from sklearn.model_selection import train_test_split # load sample dataset = load_iris() data = dataset['data'] target = dataset['target'] # train_test_split x_train, x_valid, y_train, y_valid = train_test_split(data, target, test_size=0.2, shuffle=True, st..

    ImageDataGenerator

    딥러닝 모델의 overfitting을 방지하고 성능을 높히는 가장 근본적인 방법은 학습 데이터의 다양성을 늘리는 것이다. Data Augmentation은 이 문제를 해결하기 위한 방법 중 하나로 원본 이미지 데이터를 다양한 버전으로 만들어 학습시키는 것이다. 대표적인 augmentation 기법으로는 원본 이미지를 수평 또는 수직 반전 시키는 방법, 회전시키는 방법, 일부를 짜르는(crop) 방법, RGB 채널 순서를 바꾸거나 픽셀값을 변경하여 원본 이미지의 색조를 변경시키는 것들이 있다. 사용법 generator 생성 train_datagen = ImageDataGenerator(rescale=1/255) validation_datagen=ImageDataGenerator(rescale=1/255) ..