전처리
서울특별시 시간별 (초)미세먼지 03: 극단값 확인
서울특별시 시간별 (초)미세먼지 03: 극단값 확인 서울특별시 시간별 (초)미세먼지 03: 극단값 확인 <R로 하는 빅데이터 분석: 데이터 전처리와 시각화>를 활용하는 예시입니다. 압축된…
R
lm + rf : 괜찮은 혼종
랜덤포레스트의 한계 부스팅의 경우도 마찬가지지만, 의사결정나무를 기반으로 한 랜덤포레스트는 반응곡선(response curve) 또는 반응곡면(response surface)가 수평선, 수평면일 수 밖에 없다. 물론 멀리서 보면…
시각화
대한민국 인구구조 변화를 보여주는 다른 그림: `ggridges`(`ggplot2` 확장)
ggplot2 확장 : ggridges ggridges 패키지는 공식사이트에서 설명하고 있듯이 부분적으로 겹쳐지는 선그림을 통해 시간 또는 공간에 따라 변하는 분포를 시각화하는데 유용하다. 예를…