회귀(Regression)의 이해 - 회귀 분석이란 변수들 간의 관계를 분석하는 통계적 절차 - 독립변수와 종속변수 간의 상관 관계를 분석하는 통계적 절차 - 머신러닝의 대표적인 지도학습 방법 회귀의 목표 - 독립변수와 종속변수 간의 관계를 잘 나타내는 최적의 회귀선을 찾는 것 - 머신러닝에서는 학습이라는 과정을 통해 최적의 회귀선을 찾아냄 단순 선형회귀 분석의 목표 - 종속변수를 가장 잘 설명할 수 있는 최적의 회귀계수를 찾아 회귀선을 추적하는 것 - y = Wx + b (w는 가중치, b는 편향) - w와 b : 회귀계수(Regression Coefficients) 다중 선형회귀 분석의 목표 - 종속변수를 가장 잘 설명할 수 있는 최적의 회귀계수를 찾아 회귀선을 추정하는 것 - 독립변수가 2개 이상 ..
종속변수(label, y) : 아파트 가격 독립변수(feature, x) : 범죄율, 대중교통 접근성, 방의 개수, 학교 수, Etc. 회귀 분석이란, 변수들 간의 관계를 분석하는 통계적 절차. 독립변수와 종속변수 간의 상관 관계를 분석하는 통계적 절차. 선형 회귀 분석(Linear Regression) - 독립변수와 종속변수의 관계가 선형인 경우. - 독립변수가 1개인 경우 : 단순 선형 회귀(Simple Linear Regression) - 독립변수가 2개 이상인 경우 : 다중 선형 회귀(Multiple Linear Regression) sklearn.linear_model의 LinearRegression 사용 1) 회귀분석에 사용할 데이터 확인 2) LinearRegression 클래스 객체 생성 ..
모델 : 머신러닝에서 어떠한 문제를 해결하는 시스템. 문제의 유형에 따라 성능을 측정할 수 있는 지표가 다름. 회귀분석 모델의 성능 측정 회귀(Regeression)분석의 성능 지표 MSPE : 정답과 예측값 차의 제곱 가중함 R Square : MSE / 데이터셋의 분산 Adjusted R Square : R Square 값에 input feature의 개수 패널티 가중치를 준 값 분류분석 모델의 성능 측정 분류(Classification)분석의 성능 지표 Precision : 정밀도. 모델에서 모델에서 정답이 아닌 것을 얼마나 잘 걸러내는가를 보여주는 지표. Recall : 재현율. 모델에서 실제 정답을 얼마나 많이 선택하는가를 보여주는 지표. * Recall이 중요한 경우 - Test 데이터가 Po..
https://www.codepresso.kr/course/59 프리미엄 IT 교육 서비스 - 코드프레소 www.codepresso.kr 딥러닝의 핵심 개념에 대해서 배울 수 있는 좋은 강의였다. 코드프레소 체험단이 시작된지, 8일째. 강의 내용은 생각보다 짧아서 금방 끝냈다. 책으로만 이해하기에는 어려웠던 내용을 강의자료와 함께 강사님의 설명을 들으니, 이해가 훨씬 잘되었다. 코드프레소의 다음 강의가 기대된다. 강사님의 설명이 조금 뒤죽박죽인 감이 없잖아있지만, 공부를 하는데는 문제가 없었다.
깊은 층(Deep Layer) - 층을 깊게 할수록 더 복잡한 문제에 대해서 대응 가능. - 이전층에서 학습한 특징을 조합하여 더 높은 차원의 문제에 대응. 비선형성(Non-Linearity) - 선형 함수(y = ax + b)는 여러번 연산(결합)해도 선형성을 갖음. - 비선형성을 추가하면 여러번 연산(결합) 시, 더 복잡한 문제를 해결할 수 있음. 활성화 함수(Activation Function) - 선형 함수의 결과에 활성함수를 이용하여 비선형성을 확보. - 활성함수 : Step function, Sigmoid, ReLU, Than, etx. 최적화(Optimization) - 문제를 풀기 위한 최적의 가중치를 찾아가는 과정. - 사람이 지식을 습득하는 과정과 유사해 학습(Learning)이라고 함..
인공신경망(1943) - 인간의 뇌를 수학적으로 모델링할 수 있을 것이라는 아이디어에서 시작. - 인간의 뇌를 수학 모델이 복잡하게 연결된 네트워크로 표현할 수 있다고 제안. 퍼셉트론(1957) - 뇌의 기본 단위인 뉴런을 모방. - 입력 신호에 따라 0 또는 1을 출력. 딥러닝(Deep Learning) - 인공신경망을 많은 층으로 깊게 쌓은 모델이 DNN(Deep Neural Network). - DNN 모델을 마케팅 용어로 만든 것이 딥러닝이다. 퍼셉트론은 y = ax + b 수식으로 모델링된 선형 분류기. 퍼셉트론은 선형 분류기로써 AND, OR 연산에 대한 학습이 가능. 그러나 선형분류기는 XOR 문제를 해결하지 못함. 1969년 MIT AI Lab의 설립자 Minsky는 논문(Perceptro..
머신러닝 유형 1. Supervise Learning(지도 학습) 2. Unsupervised Learning(비지도 학습) 3. Reinforcement Learning(강화 학습) 1. 지도 학습 라벨이 붙여진 데이터 셋을 학습 후 신규 데이터에 라벨을 붙임. ex) 이메일 스팸 필터링, 이미지 분류 2. 비지도 학습 라벨이 없는 데이터에서 패턴을 찾음. 데이터의 특성을 스스로 파악. ex) 유사 단어 클러스터링, 유사 이미지 클러스터링 3. 강화 학습 피드백 또는 보상을 통하여 학습을 진행. ex) 체스게임, 알파고 지도 학습의 종류 * 분류(Classification) 분석 - 문서 분류, 이미지 분류 * 회귀(Regression) 분석 - 주식 가격 예측, 부동산 가격 예측 머신러닝을 위한 6단..
AI 개요 인공지능 : 학습, 문제 해결, 패턴 인식 등 인지 문제를 해결하는 컴퓨터 공학 분야 1943년 처음으로 개념이 태동 최근 빅데이터와 컴퓨팅 성능 향상으로 인해 폭발적인 성장 중 Narrow AI < General AI < Super AI 머신러닝 : 인공지능을 구현하는 구체적인 접근 방식 중 하나 기존의 방식은 코드를 통해서 수행 방법을 구체적으로 명시(심볼릭 AI) 머신러닝은 코드가 아닌 대량의 데이터로부터 학습을 하고, 학습된 모델을 통해 판단 또는 예측을 함. 머신러닝? 기계가 배운다. 전통적인 프로그래밍 기법을 통한 스팸 메일 필터 1. 스팸 메일에 주로 나타나는 단어 및 메일의 패턴 연구 2. 발견한 단어 및 패턴을 감지해내는 알고리즘 코드 작성 3. 만족할만한 성능이 나올 때까지 ..
https://www.codepresso.kr/course/63 프리미엄 IT 교육 서비스 - 코드프레소 www.codepresso.kr 코드프레소 체험단 활동을 시작한지, 6일이 되는 오늘. 드디어 트랙의 첫번째 강의 완강했다. 사실 그렇게 긴 강의는 아니었는데, 하루에 하나씩만 듣는다고 좀 오래걸렸다. 좀 속도를 높여야겠다.. 이 강의의 좋은 점은 머신러닝의 기초를 정말 알기쉽게 설명해주고 직접 따라할 수 있다는 데에 있다. 책으로 보면서 공부하려하면, 안그래도 어려운 내용을 글로서 읽으려하는 것은 버거운 일이 아닐 수 없다. 그러나 "파이썬으로 시작하는 머신러닝" 강의는 강사님의 알기 쉬운 설명과 웹 내에서 바로 실습할 수 있는 환경 덕분에 온전히 강의에 집중할 수 있었다. 무엇보다 머신러닝을 돌리..