data preprocessing
여전히 data.table
db-benchmark 에서는 가장 최신의 오픈소스 툴을 사용하여 데이터 전처리 성능을 측정하고 있습니다. Polars라는 새로운 강자가 등장하긴 했지만, 여전히 data.table은 최상위권을 유지하고 있습니다. (여기서…
data preprocessing
부분 가로/세로형
melt-dcast 조합 가로/세로형 변환에서 가장 쉬운 방법은 gather/spread 조합일 것이다. 하지만 완전한 세로형/가로형이 아니라 일부 가로/세로형의 경우에는 melt/dcast 조합을 사용할 필요가 있다.…
data preprocessing
aggregate 2 dplyr
dat <- data.frame(gender=c('M','M','M','M','M','F','F','F','F','F'), num=c(1,2,3,1,2,3,1,2,3,1), h=c(170,180,190,180,170,150,160,170,160,150), w=c(80,70,100,80,60,50,50,60,60,50)) dat$BMI <- dat$w/(dat$h/100)^2 table(dat$gender, dat$num) ## ## 1 2 3 ## F 2 1 2 ##…
data preprocessing
집단별 함수 적용
집단별로 함수 적용하기 벡터 v에 한 학급의 학생 키가 저장되어 있다. 이때 남자의 키 평균과 여자의 키 평균을 구하고 싶다면 어떻게 해야…