admin

기술통계

1변수 요약통계량

1변수 기술 통계량 기술 통계량(Descriptive Statitistics)은 주어진 자료를 몇 개의 숫자로 요약하여 나타내기 위해 구한다. 예를 들어 평균이나 분산, 표준편차 등을 구하는…

전처리

Rolling Join

데이터테이블의 Rolling-join 데이터 테이블은 dplyr보다 훨씬 빠를 뿐 아니라, dplyr에서 지원하지 않는 기능도 가지고 있다. 그 중의 하나가 Rolling-join이다. Rolling-join은 기준되는 컬럼이…

데이터 전처리

CREAD

데이터의 생성, 참조, 수정, 추가, 삭제 데이터의 구조에 무관하여 가장 기본적인 데이터 처리는 크게 CREAD(Create(생성), Read(참조[1]), Edit(수정), Add(추가), Delete(수정))이 있다. 처음에는 각…

전처리

다차원 배열

3+차원 배열 11차원 물리학자들은 세상에 11차원일지 모른다는 학설을 연구한다고 한다. 상당히 놀라운 일이다. 인간이 11차원을 상상할 수 있다니! 데이터 프레임 또는 2차원…

불러오기

엑셀 파일의 모든 시트 읽어오기

엑셀 화일의 모든 시트(sheet) 읽어오기 엑셀의 한 화일 안에는 여러 개의 시트가 존재할 수 있습니다. package:readxl의 read_excel(path=filename, sheet=)을 통해 시트를 하나씩 읽어올…