프로젝트

프로젝트/코드프레소 체험단

시각화를 위한 Matplotlib, Pandas 활용하기

Matplotlib 기본 코드 설명 - import matplotlib.pyplot as plt : 라이브러리 로딩 - plt.figure(figsize=(10,5)) : 그래프의 사이즈 조정을 위해 figsize 지정 - plt.xlim(min,max), plt.ylim(min,max) : x축, y축의 시각화 범주 설정 - plt.show() : 그래프 화면에 시각화 Pandas 의 시각화 코드 설명 - series객체명.plot(kind='bar) - .plot() : Pandas 는 Matplotlib 의 시각화 함수 일부 내장됨. - kind='bar': 막대그래프 시각화 옵션, kind 옵션을 통해 그래프의 형태 변경 가능함

프로젝트/코드프레소 체험단

파이썬으로 구현하는 머신러닝 : 회귀분석 - 사이킷런 활용한 라쏘 규제 실습

머신러닝에서는 과대적합(overfitting)을 줄이면서, 일반성을 가지는 모델을 생성하는 것이 중요함 이를 위해 사용되는 규제 기법에는 릿지(ridge) 회귀, 라쏘(lasso) 회귀 기법 등이 있음 라쏘 회귀(Lasso Regression) - 회귀계수의 절대값에 페널티를 부여하는 방식 - 불필요한 회귀 계수를 0에 근사하도록 만들어 과대적합 개선 - 주로 Feature Selection 의 목적으로 사용 - L1 규제라고도 함 - 모델러에 의해 지정된 alpha 값을 통해서 페널티를 조정할 수 있음 1) alpha 값 정의 2) Lasso(alpha) 클래스 객체 생성 3) fit(X, y) 을 통해 학습 데이터 연결 및 규제 학습 수행 4) predict(X) 통해 학습된 모델의 예측 수행 5) ..

프로젝트/코드프레소 체험단

파이썬으로 구현하는 머신러닝 : 회귀분석 - 사이킷런 활용한 릿지 규제 실습

머신러닝에서는 과대적합(overfitting)을 줄이면서, 일반성을 가지는 모델을 생성하는 것이 중요함 이를 위해 사용되는 규제 기법에는 릿지(ridge) 회귀, 라쏘(lasso) 회귀 기법 등이 있음 릿지 회귀(Ridge Regression) - 회귀계수의 제곱 값에 페널티를 부여하는 방식 - 회귀 계수 값의 크기를 감소시켜 과적합을 개선하는 방식 - L2 규제라고도 함 - 모델러에 의해 지정된 alpha 값을 통해서 페널티를 조정할 수 있음 1) alpha 값 정의 2) Ridge(alpha) 클래스 객체 생성 3) fit(X, y) 을 통해 학습 데이터 연결 및 규제 학습 수행 4) predict(X) 통해 학습된 모델의 예측 수행 5) score(X, y) 통해 R^2 값 확인(모델의 성능 지표 ..

프로젝트/코드프레소 체험단

파이썬으로 구현하는 머신러닝 : 회귀분석 - 규제의 이해

규제(Regularization)의 이해 머신러닝의 목표 - 과대적합(Overfitting)을 줄이면서 일반성을 가지는 모델의 생성 -> 규제 기법을 사용하여 모델의 복잡도를 낮춘다. 과대적합이 발생하는 이유 - 최적의 계수를 찾기 위해, 손실함수의 갑을 최소화시키기위해, 학습데이터셋에 모델이 맞춰질 수 밖에 없다. 규제의 이해 - 규제 회귀(Regularized Regression), 벌점화 회귀(Penalized Regression) - 손실함수 최소화되는 모델을 만들면서, 모델의 overfitting을 최소화하는 기법 -> RSS + Penalty(회귀계수에 대한 패널티) - 규제란, 회귀계수 값을 감소시켜 과대적합을 개선하는 방식 과대적합의 최소화 - 독립변수 별 영향력(회귀계수)을 줄이거나, 0..

프로젝트/코드프레소 체험단

파이썬으로 구현하는 머신러닝 : 회귀분석 - 다중 선형회귀 분석 실습

다중 선형회귀 분석의 목표 : 종속변수를 가장 잘 설명할 수 있는 최적의 회귀변수를 찾아 회귀선을 추정하는 것 * LinearRegression API의 Method(함수) - fit(X, y) : 학습 데이터를 이용하여 모델의 회귀계수(w) 와 편향(b)을 학습 - predict(X) : 모델에 테스트 데이터를 입력하여 계산된 예측값 반환 - score(X, y) : 모델에 테스트 데이터를 입력하여 모델의 성능지표(𝑅^2) 반환 * LinearRegression API의 Attribute(속성) - coef_: 학습된 모델의 회귀 계수(W) - intercept_: 학습된 모델의 bias 값(b) 13개의 독립변수(feature 속성)로 1개의 종속변수(lable) 예측하는 다중 선형회귀 분석 모델 -..

KimCookieYa
'프로젝트' 카테고리의 글 목록 (33 Page)