이론
피처 엔지니어링 3: 베이지안
지난 번의 문제를 다시 한 번 보자. 다음의 R 코드는 데이터 dat를 생성한다. 이때 설명변수는 x1에서 x10은 상관관계 0.1인 표준정규분포를 따른다. 실제…
이론
피처 엔지니어링 2
새로운 피처를 만드는 것이 어떻게 좋은 예측 모형을 만드는데 도움이 되는가? 다음의 R 코드는 데이터 dat를 생성한다. 이때 설명변수는 x1에서 x10은 상관관계…
전처리
‘for’, ‘벡터화 연산’, 그리고 ‘C++의 for’
이 글에서 for문과 벡터화 연산, 그리고 C++의 for문의 속도를 비교한다. 이 과정에서 문항별 정답, 문항별 유형 자료가 있을 때, 유형별 총점을 구하는…
미분류
행렬, 행렬, 행렬
IEEE는 Institute of Electrical and Electronics Engineers의 약자이며 보통 I-Triple-E(아이 트리플 이)라고 읽는다. AAA 건전지는 영어권 나라에서 보통 triple A라고 읽는다. NCAA는…
이론
BLACK BOX 모형 살펴보기: 모형의 예측, 잔차 02
library(dplyr) library(ggplot2) library(randomForest) TURE <- TRUE 모형, 잔차 여기서는 ICEbox 패키지와 plotmo 패키지를 사용하여 모형을 좀 더 살펴본다. 예제 모형 여기서는 지난…