[R스터디:RQuestions] 첫 번째 시간/alluvial plot
WeGetRQuestions(22/02/19) WeGetRQuestions(22/02/19) 첫 번째 시간 첫 번째 시간에 세 분이 참석하셨습니다. 두 분은 질문을 가지고 오셨는데, 그 질문에 대해 알아봅시다. 파일 인코딩…
서울특별시 시간별 (초)미세먼지 03: 극단값 확인
서울특별시 시간별 (초)미세먼지 03: 극단값 확인 서울특별시 시간별 (초)미세먼지 03: 극단값 확인 <R로 하는 빅데이터 분석: 데이터 전처리와 시각화>를 활용하는 예시입니다. 압축된…
aggregate 2 dplyr
dat <- data.frame(gender=c('M','M','M','M','M','F','F','F','F','F'), num=c(1,2,3,1,2,3,1,2,3,1), h=c(170,180,190,180,170,150,160,170,160,150), w=c(80,70,100,80,60,50,50,60,60,50)) dat$BMI <- dat$w/(dat$h/100)^2 table(dat$gender, dat$num) ## ## 1 2 3 ## F 2 1 2 ##…
dplyr을 SQL로
install.packages(dplyr) install.packages(nycflights13) install.packages(sqldf) #install.packages('RSQLite') dplyr을 SQL로 번역하기 데이터 분석가에게 필요한 역량 중의 하나가 SQL(Structured Query Language)이다. 하지만 시간을 내어 배우기 힘들고, 간단하게…
dplyr을 data.table로 번역하기
패키지 데이터테이블(data.table) package:dplyr과 package:data.table의 비교 package:data.table는 대용량의 데이터를 분산 처리 시스템의 도움없이 처리할 수 있는 최선의 방법이다. 여러 벤치마킹 결과는 데이터테이블(data.table)이 빅데이터를…