데이터 전처리
서울특별시 시간별 (초)미세먼지 03: 극단값 확인
서울특별시 시간별 (초)미세먼지 03: 극단값 확인 서울특별시 시간별 (초)미세먼지 03: 극단값 확인 <R로 하는 빅데이터 분석: 데이터 전처리와 시각화>를 활용하는 예시입니다. 압축된…
데이터 전처리
서울시 미세/초미세 먼지(2/N)
서울특별시 시간별 (초)미세먼지 02 서울특별시 시간별 (초)미세먼지 02 <R로 하는 빅데이터 분석: 데이터 전처리와 시각화>를 활용하는 예시입니다. 압축된 데이터 읽기 전처리 과정은…
데이터 전처리
서울시의 미세/초미세먼지(1/n)
서울특별시 시간별 (초)미세먼지 서울특별시 시간별 (초)미세먼지 <R로 하는 빅데이터 분석: 데이터 전처리와 시각화>를 활용하는 예시입니다. 압축된 데이터 읽기 서울특별시 시간별 (초)미세먼지 데이터를…
데이터 전처리
파일 읽기에서 BOM(Byte Order Marks)
첨부파일: 서울시 한강공원 이용객 현황 (2009_2013년).csv 책에는 BOM에 대해 자세하게 설명하였습니다. UTF-8-BOM의 경우 Notepad++에서 인코딩을 확인할 수 있습니다만, 또 뭐 굳이 그것때문에…
데이터 전처리
여전히 data.table
db-benchmark 에서는 가장 최신의 오픈소스 툴을 사용하여 데이터 전처리 성능을 측정하고 있습니다. Polars라는 새로운 강자가 등장하긴 했지만, 여전히 data.table은 최상위권을 유지하고 있습니다. (여기서…