이론
두 변수의 상관계수와 유클리드 거리
Correlation coefficient and Euclidean distance 이산확률변수 \(X\) , \(Y\) 를 가정하다. 이때 \(X=x_i\), \(Y=y_i\) 의 확률은 모두 \(1/n\) 으로 균일하다고 가정해보자. 그리고…
화일
R에서 화일/디렉토리 관리
화일과 디렉토리 관련 함수들 종종 R에서 화일/디렉토리를 생성, 변경, 복사, 삭제해야 할 일이 있습니다. 자주 사용하지 않는 함수라서 잘 기억나지 않는 경우가…
전처리
dplyr을 data.table로 번역하기
패키지 데이터테이블(data.table) package:dplyr과 package:data.table의 비교 package:data.table는 대용량의 데이터를 분산 처리 시스템의 도움없이 처리할 수 있는 최선의 방법이다. 여러 벤치마킹 결과는 데이터테이블(data.table)이 빅데이터를…