인공지능 29

[파이썬 머신러닝 완벽가이드] Ch4. Practice 산탄데르 고객 만족 예측

In [14]: from IPython.core.display import display, HTML display(HTML("")) 산탄데르 고객 만족 예측¶데이터 링크 https://www.kaggle.com/c/santander-customer-satisfaction/data data preprocessing¶ In [ ]: import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib cust_df = pd.read_csv("./santander-customer-satisfaction/train_santander.csv") print('dataset shape : ', cust_df.sha..

[파이썬 머신러닝 완벽가이드] Ch.5 Regression

In [64]: from IPython.core.display import display, HTML display(HTML("")) 회귀¶ 예측을 해야하는 부분이라서 기업에서 가장많이 활용 됨. 데이터 값이 평균과 같은 일정한 값으로 돌아가려는 경향을 이용한 통계학 기법 여러개의 독립변수와 한개의 종속변수간의 상관관계를 모델링 하는 기법을 통칭 방개수 + 아파트크기 + 주변학군 + 근처 지하철 역 갯수 (독립변수) = 아파트 가격(종속변수) feature : 독립변수 , Target : 종속변수 회귀계수(Regression coefficients) : 독립변수의 값에 영향을 미치는 회귀 계수 머신러닝 회귀예측의 핵심 주어진 피처와 결정 값 데이터 기반에서 학습을 통해 최적의 회귀 계수를 찾아내는 것 선형..

[강화 학습] Markov Decision Process

아래 책을 보고있는데, 팡요랩이라는 곳에서 저자의 강의도 함께 있길레 들으면서 정리해본다. 바닥부터 배우는 강화 학습 강화 학습 기초 이론부터 블레이드 & 소울 비무 AI 적용까지이 책은 강화 학습을 모르는 초보자도 쉽게 이해할 수 있도록 도와주는 입문서입니다. 현업의 강화 학습 전문가가 직접 설명해 강화 book.naver.com 강화학습 기초 이론 - 인프런 강화학습의 이론, 기초 개념을 탄탄히 다지고 싶은 분, 딥러닝이 강화학습에 어떻게 적용 되는지 배우고 싶으신 분께 도움이 됩니다. 중급이상 인공지능 데이터 사이언스 강화학습 데이터 과학 www.inflearn.com 팡요랩의 강의는 DeepMind의 데이비드 실버의 강의를 좀 더 쉽게 전달하고자 만들어진 강의이다. 그래서 강의자료가 영어로 되어있..

[파이썬 머신러닝 완벽가이드] Ch4. Classification

분류 개요와 결정트리 소개¶정보 균일도 측정 방법¶ 엔트로피 : 데이터 집합의 혼잡도. 다른값 섞이면 엔트로피 높음. 같으면 낮음. 정보 이득 지수 : 1-엔트로피 지수. 데이터 혼잡도가 낮으면 1-엔트로피는 높은값을 가짐. 즉 혼잡도가 낮을수록 높은 지수를 가진다. 정보이득 지수가 높은 속성을 기준으로 분할 지니계수 : 데이터가 다양한 값을 가질수록 평등하며 특정값으로 쏠릴 경우에는 불평등. 불평등할수록 1값 즉, 지니계수가 높은 속성을 기준으로 분할(혼잡도 낮음) 결정트리의 특징¶ 장점 : 쉽고 직관적임, 피처스케일링이나 정규화 등의 사전 데이터 가공 영향도가 적음. 단점 : 과적합으로 알고리즘 성능 저하(recursive하게 계속 파고들어서) -> 사전에 트리의 크기 제한하는 튜닝 필요. 결정트리 ..