https://colab.research.google.com/ Google Colaboratory colab.research.google.com Colab이란? Colaboratory(줄여서 'Colab'이라고 함)을 통해 브라우저 내에서 Python 스크립트를 작성하고 실행할 수 있습니다. 구성이 필요하지 않음 GPU 무료 액세스 간편한 공유 학생이든, 데이터 과학자든, AI 연구원이든 Colab으로 업무를 더욱 간편하게 처리할 수 있습니다. 머신러닝 Colab을 사용하면 코드 몇 줄만으로 이미지 데이터세트를 가져오고, 이 데이터세트로 이미지 분류기를 학습시키며, 모델을 평가할 수 있습니다. Colab 메모장은 Google 클라우드 서버에서 코드를 실행하므로 사용 중인 컴퓨터의 성능과 관계없이 GPU ..
GridSearchCV API를 이용하여 최적의 모델 학습 시키기 API URL: sklearn.model_selection.GridSearchCV GridSearchCV() API의 Argument(인자) estimator: 구현하고자 하는 모델(Classification, Regression) param_grid: 모델의 튜닝에 사용될 파라미터 정보, 딕셔너리 scoring: 검증 지표(성능 평가 지표) cv: Cross Validation의 Fold 숫자 refit: 최적의 파라미터로 모델을 재 학습 시킬지 여부 * Grid Search CV를 활용하여 iris 데이터셋 분류 모델을 구현하는 실습 ''' -------- [최종 출력 결과] -------- Optimal parameter: {'max..
Model Selection API - Scikit-learn API - 최적의 머신러닝 모델 탐색 - 모델 구성 및 학습에 필요한 다양한 API 제공(데이터 셋 분리, 교차 검증 분할 및 평가, 하이퍼 파라미터 튜닝, etc) 모델의 성능 개선 프로세스 만족할 만한 성능이 나올 때까지 학습, 검증, 개선 작업을 반복 수행 튜닝(개선) : Model 전체적인 구조에 대한 개선(하이퍼파라미터)과 Training 데이터셋의 전처리 방법에 대한 개선이 있다. Hyperparameter(하이퍼파라미터) - 모델의 주요 구성요소 - 모델을 구성하는 정보 중 데이터를 통해 학습할 수 없는 설정 정보 - 값 조정을 통해 모델의 성능 개선 - 모델의 검증 결과를 확인하며 사람이 조정해줘야 함 - ex) Decision..
cross_val_score() API를 이용하여 교차검증 성능 지표 계산 API URL: sklearn.model_selection.cross_val_score cross_val_score() API의 Argument(인자) estimator: 구현하고자 하는 모델(Classification, Regression) X: 데이터 세트 y: label 데이터 세트 scoring: 검증 지표(성능 평가 지표) cv: Cross Validation의 Fold 숫자 cross_val_score() API의 Return(반환 값) scores: list 형태의 Fold별 검증 결과(성능지표) * K-Fold Cross Validation를 활용하여 iris 데이터셋 분류 모델을 구현하는 실습 ''' -------..
Model Selection API - Scikit-learn API - 최적의 머신러닝 모델 탐색 - 모델 구성 및 학습에 필요한 다양한 API 제공(데이터 셋 분리, 교차 검증 분할 및 평가, 하이퍼 파라미터 튜닝, etc) 머신러닝 모델 개발 과정 1. Training 데이터셋으로 모델 학습 2. 학습된 모델을 Validation 데이터셋으로 검증 3. 검증 결과, 성능이 좋지 않으면 모델을 튜닝한 후 Training 데이터셋으로 재학습 4. 만족할만한 성능이 나올 때까지 1부터 3까지 반복 5. 최종적으로 최적화된 모델(Optimized Model)을 Testing 데이터셋으로 모델의 서비스 가능 여부를 확인 Training Data Set : 머신러닝 모델의 학습에 사용되는 데이터셋 Valida..