RL
Evolution Strategies as a Scalable Alternative to Reinforcement Learning
들어가기 전에 : 이 글은 강화학습 관련 글입니다. 차후 다른 사이트로 이동될 것입니다. 핵심적 수식 3쪽 상단의 수식은 다음과 같다. \[ \nabla_\theta…