강화학습
Evolution Strategies as a Scalable Alternative to Reinforcement Learning
들어가기 전에 : 이 글은 강화학습 관련 글입니다. 차후 다른 사이트로 이동될 것입니다. 핵심적 수식 3쪽 상단의 수식은 다음과 같다. \[ \nabla_\theta…
시각화
ggplot2 tips
몇 가지 ggplot2 팁 x가 factor일 때 geom_line() x가 factor일 때에는 geom_line()이 그려지지 않는다. 예를 들어, library(ggplot2) library(dplyr) dat = data.frame(gender=sample(c("M", "F"),…
이론
내생성: 베이지안 분석 2, Stan
베이지안 추론의 또 다른 툴은 Stan이다. JAGS가 깁스 샘플링으로 사후 분포를 구한다면, Stan은 HMC를 활용하여 사후 분포를 구한다. Stan 또는 Stan이 구현하는…
이론
인과관계 추정에서 모형 설정의 중요성
심슨과 버크슨 심슨의 역설(Simpson's paradox) R의 datasets::UCBAdmissions은 1973년 UC Berkeley의 대학원 입학 시험 결과를 보여 준다. 1973년 UC 버클리(Berkeley) 대학은 성차별로 고소를…