R
보호된 글: data.table vs dplyr 01/02
package:dplyr과 package:data.table의 비교 package:data.table는 대용량의 데이터를 분산 처리 시스템의 도움없이 처리할 수 있는 최선의 방법이다. 여러 벤치마킹 결과는 빅데이터를 처리하는데 데이터테이블(data.table)이 타의…
R
R 정규표현식: 남들은 잘 모르는 기초
R 정규표현식 : 기본 중의 기본 정규표현식에 관한 글이 많지만, 대부분은 가장 기초적인 내용을 빠트리고 있다. “R 정규표현식에는 2가지 종류의 탈출문자가 쓰인다.…
R
흐름제어 01: 조건과 반복
흐름 제어 재연 가능과 스크립트(Scripts) 스크립트란 순차적으로 실행하게 될 함수들을 모아 놓은 텍스트이다. 이는 두 가지 이유에서 큰 의미가 있다. 동일한 분석…
R
Long to Wide form
긴 형태(Long form),넓은 형태(Wide form) 변환 pdf 버전 영어로 Long form/Wide form은 우리나라 말로 직역하면 긴 형태, 넓은 형태겠지만, 세로형, 가로형으로 번역한…
R
Exploratory Data Analysis
데이터 살펴보기(요약통계치, 간편시각화) 데이터를 전체적으로 살펴보고 분석의 방향을 가늠한다. 이 과정에서 자료의 오류를 찾을 수도 있다. 특히 특이값(outlier)과 결측값(missing value)에 주목한다. 데이터에는…