머신러닝에서는 과대적합(overfitting)을 줄이면서, 일반성을 가지는 모델을 생성하는 것이 중요함 이를 위해 사용되는 규제 기법에는 릿지(ridge) 회귀, 라쏘(lasso) 회귀 기법 등이 있음 라쏘 회귀(Lasso Regression) - 회귀계수의 절대값에 페널티를 부여하는 방식 - 불필요한 회귀 계수를 0에 근사하도록 만들어 과대적합 개선 - 주로 Feature Selection 의 목적으로 사용 - L1 규제라고도 함 - 모델러에 의해 지정된 alpha 값을 통해서 페널티를 조정할 수 있음 1) alpha 값 정의 2) Lasso(alpha) 클래스 객체 생성 3) fit(X, y) 을 통해 학습 데이터 연결 및 규제 학습 수행 4) predict(X) 통해 학습된 모델의 예측 수행 5) ..
머신러닝에서는 과대적합(overfitting)을 줄이면서, 일반성을 가지는 모델을 생성하는 것이 중요함 이를 위해 사용되는 규제 기법에는 릿지(ridge) 회귀, 라쏘(lasso) 회귀 기법 등이 있음 릿지 회귀(Ridge Regression) - 회귀계수의 제곱 값에 페널티를 부여하는 방식 - 회귀 계수 값의 크기를 감소시켜 과적합을 개선하는 방식 - L2 규제라고도 함 - 모델러에 의해 지정된 alpha 값을 통해서 페널티를 조정할 수 있음 1) alpha 값 정의 2) Ridge(alpha) 클래스 객체 생성 3) fit(X, y) 을 통해 학습 데이터 연결 및 규제 학습 수행 4) predict(X) 통해 학습된 모델의 예측 수행 5) score(X, y) 통해 R^2 값 확인(모델의 성능 지표 ..
종속변수(label, y) : 아파트 가격 독립변수(feature, x) : 범죄율, 대중교통 접근성, 방의 개수, 학교 수, Etc. 회귀 분석이란, 변수들 간의 관계를 분석하는 통계적 절차. 독립변수와 종속변수 간의 상관 관계를 분석하는 통계적 절차. 선형 회귀 분석(Linear Regression) - 독립변수와 종속변수의 관계가 선형인 경우. - 독립변수가 1개인 경우 : 단순 선형 회귀(Simple Linear Regression) - 독립변수가 2개 이상인 경우 : 다중 선형 회귀(Multiple Linear Regression) sklearn.linear_model의 LinearRegression 사용 1) 회귀분석에 사용할 데이터 확인 2) LinearRegression 클래스 객체 생성 ..