Matplotlib 기본 코드 설명 - import matplotlib.pyplot as plt : 라이브러리 로딩 - plt.figure(figsize=(10,5)) : 그래프의 사이즈 조정을 위해 figsize 지정 - plt.xlim(min,max), plt.ylim(min,max) : x축, y축의 시각화 범주 설정 - plt.show() : 그래프 화면에 시각화 Pandas 의 시각화 코드 설명 - series객체명.plot(kind='bar) - .plot() : Pandas 는 Matplotlib 의 시각화 함수 일부 내장됨. - kind='bar': 막대그래프 시각화 옵션, kind 옵션을 통해 그래프의 형태 변경 가능함
머신러닝에서는 과대적합(overfitting)을 줄이면서, 일반성을 가지는 모델을 생성하는 것이 중요함 이를 위해 사용되는 규제 기법에는 릿지(ridge) 회귀, 라쏘(lasso) 회귀 기법 등이 있음 라쏘 회귀(Lasso Regression) - 회귀계수의 절대값에 페널티를 부여하는 방식 - 불필요한 회귀 계수를 0에 근사하도록 만들어 과대적합 개선 - 주로 Feature Selection 의 목적으로 사용 - L1 규제라고도 함 - 모델러에 의해 지정된 alpha 값을 통해서 페널티를 조정할 수 있음 1) alpha 값 정의 2) Lasso(alpha) 클래스 객체 생성 3) fit(X, y) 을 통해 학습 데이터 연결 및 규제 학습 수행 4) predict(X) 통해 학습된 모델의 예측 수행 5) ..
머신러닝에서는 과대적합(overfitting)을 줄이면서, 일반성을 가지는 모델을 생성하는 것이 중요함 이를 위해 사용되는 규제 기법에는 릿지(ridge) 회귀, 라쏘(lasso) 회귀 기법 등이 있음 릿지 회귀(Ridge Regression) - 회귀계수의 제곱 값에 페널티를 부여하는 방식 - 회귀 계수 값의 크기를 감소시켜 과적합을 개선하는 방식 - L2 규제라고도 함 - 모델러에 의해 지정된 alpha 값을 통해서 페널티를 조정할 수 있음 1) alpha 값 정의 2) Ridge(alpha) 클래스 객체 생성 3) fit(X, y) 을 통해 학습 데이터 연결 및 규제 학습 수행 4) predict(X) 통해 학습된 모델의 예측 수행 5) score(X, y) 통해 R^2 값 확인(모델의 성능 지표 ..
규제(Regularization)의 이해 머신러닝의 목표 - 과대적합(Overfitting)을 줄이면서 일반성을 가지는 모델의 생성 -> 규제 기법을 사용하여 모델의 복잡도를 낮춘다. 과대적합이 발생하는 이유 - 최적의 계수를 찾기 위해, 손실함수의 갑을 최소화시키기위해, 학습데이터셋에 모델이 맞춰질 수 밖에 없다. 규제의 이해 - 규제 회귀(Regularized Regression), 벌점화 회귀(Penalized Regression) - 손실함수 최소화되는 모델을 만들면서, 모델의 overfitting을 최소화하는 기법 -> RSS + Penalty(회귀계수에 대한 패널티) - 규제란, 회귀계수 값을 감소시켜 과대적합을 개선하는 방식 과대적합의 최소화 - 독립변수 별 영향력(회귀계수)을 줄이거나, 0..
다중 선형회귀 분석의 목표 : 종속변수를 가장 잘 설명할 수 있는 최적의 회귀변수를 찾아 회귀선을 추정하는 것 * LinearRegression API의 Method(함수) - fit(X, y) : 학습 데이터를 이용하여 모델의 회귀계수(w) 와 편향(b)을 학습 - predict(X) : 모델에 테스트 데이터를 입력하여 계산된 예측값 반환 - score(X, y) : 모델에 테스트 데이터를 입력하여 모델의 성능지표(𝑅^2) 반환 * LinearRegression API의 Attribute(속성) - coef_: 학습된 모델의 회귀 계수(W) - intercept_: 학습된 모델의 bias 값(b) 13개의 독립변수(feature 속성)로 1개의 종속변수(lable) 예측하는 다중 선형회귀 분석 모델 -..