admin

시각화

R 플롯 팁 2

빅데이터 플롯과 알파 데이터의 크기가 매우 클 때, 기본 산점도는 여러 점에 겹치기 때문에 알파를 조정하는 방법을 많이 쓴다. library(data.table) library(ggplot2) library(dplyr)…

EDA

Summarising data frame

데이터 프레임 살펴보기 최근 특강을 준비하면서, 데이터 프레임 전체에 대해 요약/정리하는 패키지/함수가 여럿 개발되었음을 확인하였습니다. 여기서는 mtcars를 활용하여 이들을 사용하는 예를 보이겠습니다.…

에러

패키지 설치에서 나타나는 Permission denied

패키지 설치가 되지 않을 때 한번은 DataExplorer 패키지를 설치하려다 다음과 같은 에러가 발생했다. library(DataExplorer) Error: package or namespace load failed for ‘DataExplorer’…

분석

회귀: 내삽과 외삽

내삽과 외삽 회귀는 많은 사람들에게 생소하게 느껴질 단어인 내삽(interpolation)과 외삽(extrapolation)으로 구분해 볼 수 있다. 손수회귀의 관점에서 볼 때, 내삽이란 주위에 데이터가 많을…

Python

Python 디버깅: `print` 함수 가로채기

디버깅 디버깅은 프로그래머의 숙명이다. 사람들은 프로그래머가 하는 일의 80%가 디버깅이라고도 한다. Python과 디버깅 파이썬을 쓰면서 불편한 점의 하나는 디버깅이다. 특히 실행하는데 시간이…