admin

전처리

윈도우에서 문자열 인코딩 문제

윈도우에서 문자열의 인코딩 문제 움라우트(Umlaut) UTF-8test.txt에는 다음의 내용이 저장되어 있다. "création d'un rôle",""ÿ"" "初演","重役" "초연",""중역"이라고" <문자열> 장에서 좀 더 자세히 살펴보겠지만, 쉼표로…

전처리

날짜와 시간 자료

R의 날짜와 시간 “2018년 최대 황금연휴였던 추석은 2019년엔 아쉬움을 줄 것 같습니다.” R에서 날짜와 시간을 나타내는 데 쓰이는 클래스는 세 다음의 세…

전처리

stri_enc_list

stri_enc_list stri_encode(str, from=, to=)의 from=과 to=에 사용되는 코드 이름은 stri_enc_list()로 찾아볼 수 있다. 다음은 내 노트북에서 stri_enc_list()를 실행한 결과입니다. library(stringi) stringi::stri_enc_list() ##…

시각화

대한민국 인구구조 변화를 보여주는 다른 그림: `ggridges`(`ggplot2` 확장)

ggplot2 확장 : ggridges ggridges 패키지는 공식사이트에서 설명하고 있듯이 부분적으로 겹쳐지는 선그림을 통해 시간 또는 공간에 따라 변하는 분포를 시각화하는데 유용하다. 예를…

시각화

gganimate 예: 한국의 인구 구조 변화

링크에 가보면 ggplot2의 확장 패키지들이 소개되어 있습니다. 이 중 첫 번째 패키지는 gganimate입니다. Hans Rosling 선생께서 우리의 눈과 귀를 즐겁게 해주었던…