빅데이터
여전히 data.table
db-benchmark 에서는 가장 최신의 오픈소스 툴을 사용하여 데이터 전처리 성능을 측정하고 있습니다. Polars라는 새로운 강자가 등장하긴 했지만, 여전히 data.table은 최상위권을 유지하고 있습니다. (여기서…
미분류
메타프로그래밍: 거울 테스트, 메타 인지, 스스로 발전하는 프로그램(aka 인공지능)
메타 메타 인지라 인지를 인지하는 것이다. 메타 프로그래밍이란 프로그램을 프로그래밍하는 것이다. 자기 인식(self-awareness) 자기를 인식(self-awareness)할 수 있는 동물은 많지 않다고 한다. 다음의…
이론
모형의 예측을 활용한 EDA와 피처 엔지니어링
예측 모형의 의미 library(dplyr) library(ggplot2) library(randomForest) 예측 모형은 기본적으로 \(f(\vec{x})\) 이다.[1] 주어진 설명 변수 \(\vec{x}\) 에 대해 결과 변수 \(y\) 를 예측한다.…
강화학습
Evolution Strategies as a Scalable Alternative to Reinforcement Learning
들어가기 전에 : 이 글은 강화학습 관련 글입니다. 차후 다른 사이트로 이동될 것입니다. 핵심적 수식 3쪽 상단의 수식은 다음과 같다. \[ \nabla_\theta…
데이터
제8장. R로 데이터 읽어오기
R로 하는 빅데이터 분석: 데이터 전처리와 시각화(개념적 기초에서 심층 활용까지) 의 제 8장 `R로 데이터 읽어오기'의 데이터 화일입니다. dat 서울시 한강공원 이용객 현황…