서울특별시 시간별 (초)미세먼지 03: 극단값 확인
서울특별시 시간별 (초)미세먼지 03: 극단값 확인 서울특별시 시간별 (초)미세먼지 03: 극단값 확인 <R로 하는 빅데이터 분석: 데이터 전처리와 시각화>를 활용하는 예시입니다. 압축된…
여전히 data.table
db-benchmark 에서는 가장 최신의 오픈소스 툴을 사용하여 데이터 전처리 성능을 측정하고 있습니다. Polars라는 새로운 강자가 등장하긴 했지만, 여전히 data.table은 최상위권을 유지하고 있습니다. (여기서…
aggregate 2 dplyr
dat <- data.frame(gender=c('M','M','M','M','M','F','F','F','F','F'), num=c(1,2,3,1,2,3,1,2,3,1), h=c(170,180,190,180,170,150,160,170,160,150), w=c(80,70,100,80,60,50,50,60,60,50)) dat$BMI <- dat$w/(dat$h/100)^2 table(dat$gender, dat$num) ## ## 1 2 3 ## F 2 1 2 ##…
패키지 dplyr 03: 편의 기능
dplyr : 부가 기능 만일 동일한 함수를 여러 열에 동일하게 적용해야 한다고 생각해보자. 여기서 여러 열은 모든 열일 수도 있고, 미리 정해진…
패키지 dplyr 02: 수정
dplyr의 방식 : 수정 새로운 열 추가 새로운 열을 추가하고자 한다면 mutate 함수를 사용한다. 열이름은 정하거나 생략할 수 있다. 여러 열을 함께…