R
Relative Risk Regression
Relative Risk Regression Relative Risk Regression 2022-06-29 Relative Risk Regression 결과값이 삶/죽음, 예/아니오 와 같이 이항 반응(binary response)인 경우 가장 널리 사용되는…
Analysis
결측값 다루기 : 왜 평균대체가 문제인가?
Missing Missing 결측값을 포함한 자료 분석하기 결측값을 포함한 자료를 분석할 때에는 결측값의 존재에 대해 신경을 써야 한다. 가장 중요한 점은 결측값이 발생하는…
한글
[R스터디:RQUESTIONS] 한글 인코딩, fixed effect model
WeGetRQuestions(22/03/05) WeGetRQuestions(22/03/05) 두 번째 시간 지난 주에는 참석 예정이었던 분이 모두 밀접 접촉자가 되어 쉬었습니다. 이번 주가 2번째 시간이었습니다. 모두 첫 번째…
R
lm + rf : 괜찮은 혼종
랜덤포레스트의 한계 부스팅의 경우도 마찬가지지만, 의사결정나무를 기반으로 한 랜덤포레스트는 반응곡선(response curve) 또는 반응곡면(response surface)가 수평선, 수평면일 수 밖에 없다. 물론 멀리서 보면…
이론
피처 엔지니어링 3: 베이지안
지난 번의 문제를 다시 한 번 보자. 다음의 R 코드는 데이터 dat를 생성한다. 이때 설명변수는 x1에서 x10은 상관관계 0.1인 표준정규분포를 따른다. 실제…