데이터가공
세로형, 가로형 변환(gather/spread)
세로형/가로형 변환 영어로는 보통 long-form/wide-form으로 불리는 두 형태를 여기서는 세로형/가로형이라고 부르겠다.[g1] [g1]: 한 수강생의 제안인데 괜찮은 것 같다. 가로형(wide-form)은 보통 한 개체에…
한글
한글 초/중/종성 나누기: 키보드 기준
cho <- unlist(strsplit("ㄱㄲㄴㄷㄸㄹㅁㅂㅃㅅㅆㅇㅈㅉㅊㅋㅌㅍㅎ", "")) jung <- unlist(strsplit("ㅏㅐㅑㅒㅓㅔㅕㅖㅗㅘㅙㅚㅛㅜㅝㅞㅟㅠㅡㅢㅣ", "")) intToUtf8v <- Vectorize(intToUtf8) #jong2 <- c(" ", intToUtf8v(4520:(4520+26))) # 4520 = ㄱ #jong <-…
정규표현식
정규표현식을 활용한 문자열 가공: 개념적 접근
정규표현식을 활용한 문자열 데이터 가공: 개념적 접근 정규표현식은 문자열 패턴을 나타낸다. 이를 활용해서 다음과 같은 작업을 할 수 있다. 탐지 : 정규표현식…