GridSearchCV API를 이용하여 최적의 모델 학습 시키기 API URL: sklearn.model_selection.GridSearchCV GridSearchCV() API의 Argument(인자) estimator: 구현하고자 하는 모델(Classification, Regression) param_grid: 모델의 튜닝에 사용될 파라미터 정보, 딕셔너리 scoring: 검증 지표(성능 평가 지표) cv: Cross Validation의 Fold 숫자 refit: 최적의 파라미터로 모델을 재 학습 시킬지 여부 * Grid Search CV를 활용하여 iris 데이터셋 분류 모델을 구현하는 실습 ''' -------- [최종 출력 결과] -------- Optimal parameter: {'max..
Model Selection API - Scikit-learn API - 최적의 머신러닝 모델 탐색 - 모델 구성 및 학습에 필요한 다양한 API 제공(데이터 셋 분리, 교차 검증 분할 및 평가, 하이퍼 파라미터 튜닝, etc) 모델의 성능 개선 프로세스 만족할 만한 성능이 나올 때까지 학습, 검증, 개선 작업을 반복 수행 튜닝(개선) : Model 전체적인 구조에 대한 개선(하이퍼파라미터)과 Training 데이터셋의 전처리 방법에 대한 개선이 있다. Hyperparameter(하이퍼파라미터) - 모델의 주요 구성요소 - 모델을 구성하는 정보 중 데이터를 통해 학습할 수 없는 설정 정보 - 값 조정을 통해 모델의 성능 개선 - 모델의 검증 결과를 확인하며 사람이 조정해줘야 함 - ex) Decision..
cross_val_score() API를 이용하여 교차검증 성능 지표 계산 API URL: sklearn.model_selection.cross_val_score cross_val_score() API의 Argument(인자) estimator: 구현하고자 하는 모델(Classification, Regression) X: 데이터 세트 y: label 데이터 세트 scoring: 검증 지표(성능 평가 지표) cv: Cross Validation의 Fold 숫자 cross_val_score() API의 Return(반환 값) scores: list 형태의 Fold별 검증 결과(성능지표) * K-Fold Cross Validation를 활용하여 iris 데이터셋 분류 모델을 구현하는 실습 ''' -------..
Model Selection API - Scikit-learn API - 최적의 머신러닝 모델 탐색 - 모델 구성 및 학습에 필요한 다양한 API 제공(데이터 셋 분리, 교차 검증 분할 및 평가, 하이퍼 파라미터 튜닝, etc) 머신러닝 모델 개발 과정 1. Training 데이터셋으로 모델 학습 2. 학습된 모델을 Validation 데이터셋으로 검증 3. 검증 결과, 성능이 좋지 않으면 모델을 튜닝한 후 Training 데이터셋으로 재학습 4. 만족할만한 성능이 나올 때까지 1부터 3까지 반복 5. 최종적으로 최적화된 모델(Optimized Model)을 Testing 데이터셋으로 모델의 서비스 가능 여부를 확인 Training Data Set : 머신러닝 모델의 학습에 사용되는 데이터셋 Valida..
https://www.codepresso.kr/course/67 프리미엄 IT 교육 서비스 - 코드프레소 www.codepresso.kr 코드프레소 체험단 활동 중, 인공지능 트랙 로드맵의 "파이썬으로 구현하는 머신러닝" 강의 4개를 완강했다. 순서대로 회귀분석, 분류분석, 트리모델, 비지도학습을 공부했다. 코드프레소 강의의 장점은 강의를 들으면서 바로 코드를 작성하여 결과를 볼 수 있다는 것이다. 실습을 바로 하니까 머리에 더 남는다. 다만 서버 문제인지 코드를 똑같이 작성했음에도 오류가 뜰 때가 종종 있었다. 그래도 강의 내용은 훌륭했다. 회귀분석과 분류분석, 트리모델에 대한 강의 내용은 쉬웠다. 코드프레소의 강의 방식과 웹의 구성이 교육에 적합했기 때문이다. 그러나, 비지도학습에 대한 강의부터는 좀..