4. 데이터 시각화 > 4-1. 베이스 R로 시각화하기
베이스 R로 시각화하기
이번 장부터는 데이터 분석 과정에서 가장 재미있는(🙄) 시각화에 대해 학습해 보겠습니다.
우선, gapminder 데이터를 통해 베이스 R로 시각화하는 방법에 대해 알아보겠습니다. gapminder 데이터에는 5개 대륙, 총 142개 국가에 대한, 1952~2007년의 인구 데이터가 5년 간격으로 담겨 있습니다. 대륙별로 묶어 인구 변화 추이를 관찰해 보겠습니다.
library(gapminder)
library(dplyr)
(data <- gapminder %>%
group_by(year, continent) %>%
summarize(pop_total = sum(pop)))
요약된 결과를 베이스 R이 제공하는 plot
함수로 시각화해보겠습니다.
plot(x축 변수, y축 변수)
plot(data$year, data$pop_total)
마커의 색상이나 모양을 변경하는 방법은 다음과 같습니다.
마커 색상 변경
plot(x축 변수, y축 변수, col='색상 인덱스 혹은 색상 이름')
# 1. 색상 인덱스
plot(data$year, data$pop_total, col = 1) # black
plot(data$year, data$pop_total, col = c(1:3)) # black, red, green
# 2. 색상 이름
plot(data$year, data$pop_total, col = c('black', 'red', 'green'))
# 3. col = '범주형 속성변수'도 가능하다
plot(data$year, data$pop_total, col = data$continent)
마커 모양 변경
plot(x축 변수, y축 변수, pch='모양 인덱스 혹은 마커 기호')
# 1. 모양 인덱스
plot(data$year, data$pop_total, pch = c(1:5))
# 2. 마커 기호
plot(data$year, data$pop_total, pch = '$') # 마커 모양: $
마커 기호 모양(pch) [출처]
plot(x축 변수, y축 변수, pch = c(1 : length(levels(데이터$범주형_속성변수))))
length(변수)
: 변수의 요소 개수를 반환levels(범주형 변수)
: 범주형 변수를 문자벡터로 변환plot(data$year, data$pop_total, pch = c(1 : length(levels(data$continent))))
시각화 결과에 각 마커를 설명하는 범례(legend)를 표시하면 기본적인 시각화가 완성됩니다.
legend('범례위치', legend = c('범례명'), pch = c('범례기호'), col = ('범례색상'))
# 1. 범례명 직접 입력
legend('topleft', legend = c('Africa', 'Americas', 'Asia', 'Europe', 'Oceania'), pch = c(1:5), col = c(1:5))
# 2. 범주형 속성변수 활용
# 해당 명령어를 사용할 경우, 문자벡터의 요소(levels(범주형_속성변수))와 범례명이 순서대로 일치하는지 확인해 줄 것!
legend('topleft', legend = levels(data$continent), pch = c(1:5), col = c(1:5))
gapminder 데이터와 베이스 R 명령어를 사용해, 대륙별 1인당 GDP(gdpPercap)에 따른 기대 수명(lifeExp)을 시각화해보세요.
col
속성 활용)