패키지
html_table()과 invalid multibyte string
library(rvest) rvest 패키지는 웹크롤링에 요긴하게 쓰인다. 그런데 이 패키지로 한글 표를 크롤링할 때에는 알려진 문제가 있다. 의 데이터를 크롤링해보자. url='http://fow.kr/find/af23c4ee03bd666' html=read_html(url,encoding='UTF-8')…
파이썬
파이썬에서 지역 및 인코딩 이름
파이썬 모듈 locale 다음의 코드는 파이썬 버전을 확인한 후, 파이썬의 지역 설정 및 인코딩 방법을 정할 때 쓸 수 있는 이름을 보여준다.…
전처리
stri_enc_list
stri_enc_list stri_encode(str, from=, to=)의 from=과 to=에 사용되는 코드 이름은 stri_enc_list()로 찾아볼 수 있다. 다음은 내 노트북에서 stri_enc_list()를 실행한 결과입니다. library(stringi) stringi::stri_enc_list() ##…