이론
모형의 예측을 활용한 EDA와 피처 엔지니어링
예측 모형의 의미 library(dplyr) library(ggplot2) library(randomForest) 예측 모형은 기본적으로 \(f(\vec{x})\) 이다.[1] 주어진 설명 변수 \(\vec{x}\) 에 대해 결과 변수 \(y\) 를 예측한다.…
시각화
Exploratory Data Analysis
데이터 살펴보기(요약통계치, 간편시각화) 데이터를 전체적으로 살펴보고 분석의 방향을 가늠한다. 이 과정에서 자료의 오류를 찾을 수도 있다. 특히 특이값(outlier)과 결측값(missing value)에 주목한다. 데이터에는…