피처 엔지니어링 2
새로운 피처를 만드는 것이 어떻게 좋은 예측 모형을 만드는데 도움이 되는가? 다음의 R 코드는 데이터 dat를 생성한다. 이때 설명변수는 x1에서 x10은 상관관계…
BLACK BOX 모형 살펴보기: 모형의 예측, 잔차 02
library(dplyr) library(ggplot2) library(randomForest) TURE <- TRUE 모형, 잔차 여기서는 ICEbox 패키지와 plotmo 패키지를 사용하여 모형을 좀 더 살펴본다. 예제 모형 여기서는 지난…
Black Box 모형을 살펴보기: 모형의 예측, 과적합, 잔차 01
예측 모형 살펴보기 library(dplyr) library(ggplot2) library(randomForest) 예측 모형은 기본적으로 \(f(\vec{x})\) 이다.[1] 주어진 설명 변수 \(\vec{x}\) 에 대해 결과 변수 \(y\) 를 예측한다.…
모형의 예측을 활용한 EDA와 피처 엔지니어링
예측 모형의 의미 library(dplyr) library(ggplot2) library(randomForest) 예측 모형은 기본적으로 \(f(\vec{x})\) 이다.[1] 주어진 설명 변수 \(\vec{x}\) 에 대해 결과 변수 \(y\) 를 예측한다.…
변수 선택 방법: 선형 회귀 분석으로 변수를 선택한다면?
변수 선택 예측 변수가 많으면 분석이 까다롭다. 그리고 설명변수가 적을수록 모형이 좀 더 간명하다는 장점이 있다. iseed=6 변수 선택 방법 : 선형…