화일
서울시의 미세/초미세먼지(1/n)
서울특별시 시간별 (초)미세먼지 서울특별시 시간별 (초)미세먼지 <R로 하는 빅데이터 분석: 데이터 전처리와 시각화>를 활용하는 예시입니다. 압축된 데이터 읽기 서울특별시 시간별 (초)미세먼지 데이터를…
화일
파일 읽기에서 BOM(Byte Order Marks)
첨부파일: 서울시 한강공원 이용객 현황 (2009_2013년).csv 책에는 BOM에 대해 자세하게 설명하였습니다. UTF-8-BOM의 경우 Notepad++에서 인코딩을 확인할 수 있습니다만, 또 뭐 굳이 그것때문에…
미분류
보호된 글: [공지] 데이터사이언스 문제해결 모임
모임 운영 방식 광범위한 데이터 사이언스 분야와 관련하여 자신의 경험을 소개하고, 문제를 제시합니다. 그러면 모임 참가자들이 서로 자신의 의견과 견해을 말하고, 토론합니다.…
빅데이터
여전히 data.table
db-benchmark 에서는 가장 최신의 오픈소스 툴을 사용하여 데이터 전처리 성능을 측정하고 있습니다. Polars라는 새로운 강자가 등장하긴 했지만, 여전히 data.table은 최상위권을 유지하고 있습니다. (여기서…