빅데이터
여전히 data.table
db-benchmark 에서는 가장 최신의 오픈소스 툴을 사용하여 데이터 전처리 성능을 측정하고 있습니다. Polars라는 새로운 강자가 등장하긴 했지만, 여전히 data.table은 최상위권을 유지하고 있습니다. (여기서…
데이터테이블
data.table fillna
데이터 테이블에서 결측값 채우기 데이터 테이블의 문법은 데이터 프레임의 그것과 조금 달라서 활용하는데 애를 먹을 수 있다. 하지만 데이터 테이블은 데이터 프레임으로…
전처리
dplyr을 data.table로 번역하기
패키지 데이터테이블(data.table) package:dplyr과 package:data.table의 비교 package:data.table는 대용량의 데이터를 분산 처리 시스템의 도움없이 처리할 수 있는 최선의 방법이다. 여러 벤치마킹 결과는 데이터테이블(data.table)이 빅데이터를…
전처리
보호된 글: data.table vs dplyr 01/02
package:dplyr과 package:data.table의 비교 package:data.table는 대용량의 데이터를 분산 처리 시스템의 도움없이 처리할 수 있는 최선의 방법이다. 여러 벤치마킹 결과는 빅데이터를 처리하는데 데이터테이블(data.table)이 타의…