R
lm + rf : 괜찮은 혼종
랜덤포레스트의 한계 부스팅의 경우도 마찬가지지만, 의사결정나무를 기반으로 한 랜덤포레스트는 반응곡선(response curve) 또는 반응곡면(response surface)가 수평선, 수평면일 수 밖에 없다. 물론 멀리서 보면…
분석
회귀: 내삽과 외삽
내삽과 외삽 회귀는 많은 사람들에게 생소하게 느껴질 단어인 내삽(interpolation)과 외삽(extrapolation)으로 구분해 볼 수 있다. 손수회귀의 관점에서 볼 때, 내삽이란 주위에 데이터가 많을…
이론
visualization of regression models
회귀모형 사실 많은 사람들이 회귀모형이라고 하면 선형회귀를 생각하지만, 회귀 모형은 결과 변수가 연속형인 경우에 쓰이는 일반(?) 명사이다. (보통 예측 모형을 회귀와 분류로…
이론
피처 엔지니어링 3: 베이지안
지난 번의 문제를 다시 한 번 보자. 다음의 R 코드는 데이터 dat를 생성한다. 이때 설명변수는 x1에서 x10은 상관관계 0.1인 표준정규분포를 따른다. 실제…
이론
피처 엔지니어링 2
새로운 피처를 만드는 것이 어떻게 좋은 예측 모형을 만드는데 도움이 되는가? 다음의 R 코드는 데이터 dat를 생성한다. 이때 설명변수는 x1에서 x10은 상관관계…