피처 엔지니어링 2
새로운 피처를 만드는 것이 어떻게 좋은 예측 모형을 만드는데 도움이 되는가? 다음의 R 코드는 데이터 dat를 생성한다. 이때 설명변수는 x1에서 x10은 상관관계…
‘for’, ‘벡터화 연산’, 그리고 ‘C++의 for’
이 글에서 for문과 벡터화 연산, 그리고 C++의 for문의 속도를 비교한다. 이 과정에서 문항별 정답, 문항별 유형 자료가 있을 때, 유형별 총점을 구하는…
행렬, 행렬, 행렬
IEEE는 Institute of Electrical and Electronics Engineers의 약자이며 보통 I-Triple-E(아이 트리플 이)라고 읽는다. AAA 건전지는 영어권 나라에서 보통 triple A라고 읽는다. NCAA는…
BLACK BOX 모형 살펴보기: 모형의 예측, 잔차 02
library(dplyr) library(ggplot2) library(randomForest) TURE <- TRUE 모형, 잔차 여기서는 ICEbox 패키지와 plotmo 패키지를 사용하여 모형을 좀 더 살펴본다. 예제 모형 여기서는 지난…
Black Box 모형을 살펴보기: 모형의 예측, 과적합, 잔차 01
예측 모형 살펴보기 library(dplyr) library(ggplot2) library(randomForest) 예측 모형은 기본적으로 \(f(\vec{x})\) 이다.[1] 주어진 설명 변수 \(\vec{x}\) 에 대해 결과 변수 \(y\) 를 예측한다.…