전처리
유지 보수가 편한 정규표현식
정규표현식의 유지/보수 WOL 컴퓨터 과학의 농담조 용어로 WOL(Write Only Language)란 말이 있다. 우리나라 말로 번역한다면 “수정 불가 언어” 정도 되지 않을까? 프로그래밍…
전처리
dplyr을 data.table로 번역하기
패키지 데이터테이블(data.table) package:dplyr과 package:data.table의 비교 package:data.table는 대용량의 데이터를 분산 처리 시스템의 도움없이 처리할 수 있는 최선의 방법이다. 여러 벤치마킹 결과는 데이터테이블(data.table)이 빅데이터를…
전처리
iconvlist: iconv 인코딩
iconv가 지원하는 인코딩 종류 우선 환경은 다음과 같다. sessionInfo() ## R version 3.5.2 (2018-12-20) ## Platform: x86_64-w64-mingw32/x64 (64-bit) ## Running under: Windows…
전처리
가로형/세로형 변환(reshape2::melt/dcast)
데이터 준비 library(dplyr) library(tidyr) mtcars$name = rownames(mtcars); rownames(mtcars) = NULL mtcars %>% select(name, am, mpg, cyl, disp) -> mcars head(mcars, 4) ##…