4. 데이터 시각화 > 4-1. 베이스 R로 시각화하기

베이스 R로 시각화하기


🧭 목차

  1. 베이스 R로 시각화하기
  2. ❓ 미니 퀴즈

이번 장부터는 데이터 분석 과정에서 가장 재미있는(🙄) 시각화에 대해 학습해 보겠습니다.


1) 베이스 R로 시각화하기

우선, gapminder 데이터를 통해 베이스 R로 시각화하는 방법에 대해 알아보겠습니다. gapminder 데이터에는 5개 대륙, 총 142개 국가에 대한, 1952~2007년의 인구 데이터가 5년 간격으로 담겨 있습니다. 대륙별로 묶어 인구 변화 추이를 관찰해 보겠습니다.

library(gapminder)
library(dplyr)

(data <- gapminder %>%
  group_by(year, continent) %>%
  summarize(pop_total = sum(pop)))

요약된 결과를 베이스 R이 제공하는 plot 함수로 시각화해보겠습니다.

  • plot(x축 변수, y축 변수)

    plot(data$year, data$pop_total)
    

마커의 색상이나 모양을 변경하는 방법은 다음과 같습니다.

  • 마커 색상 변경

    • plot(x축 변수, y축 변수, col='색상 인덱스 혹은 색상 이름')

      # 1. 색상 인덱스
      plot(data$year, data$pop_total, col = 1)        # black
      plot(data$year, data$pop_total, col = c(1:3))   # black, red, green
      
      # 2. 색상 이름
      plot(data$year, data$pop_total, col = c('black', 'red', 'green'))
      
      # 3. col = '범주형 속성변수'도 가능하다
      plot(data$year, data$pop_total, col = data$continent)
      
  • 마커 모양 변경

    • plot(x축 변수, y축 변수, pch='모양 인덱스 혹은 마커 기호')

      # 1. 모양 인덱스
      plot(data$year, data$pop_total, pch = c(1:5))
      
      # 2. 마커 기호
      plot(data$year, data$pop_total, pch = '$')   # 마커 모양: $
      
      • 마커 기호 모양(pch) [출처]

    • plot(x축 변수, y축 변수, pch = c(1 : length(levels(데이터$범주형_속성변수))))

      • length(변수): 변수의 요소 개수를 반환
      • levels(범주형 변수): 범주형 변수를 문자벡터로 변환
      plot(data$year, data$pop_total, pch = c(1 : length(levels(data$continent))))
      

시각화 결과에 각 마커를 설명하는 범례(legend)를 표시하면 기본적인 시각화가 완성됩니다.

  • legend('범례위치', legend = c('범례명'), pch = c('범례기호'), col = ('범례색상'))

    # 1. 범례명 직접 입력
    legend('topleft', legend = c('Africa', 'Americas', 'Asia', 'Europe', 'Oceania'), pch = c(1:5), col = c(1:5))
    
    # 2. 범주형 속성변수 활용
    # 해당 명령어를 사용할 경우, 문자벡터의 요소(levels(범주형_속성변수))와 범례명이 순서대로 일치하는지 확인해 줄 것!
    legend('topleft', legend = levels(data$continent), pch = c(1:5), col = c(1:5))
    

❓ 미니 퀴즈

gapminder 데이터와 베이스 R 명령어를 사용해, 대륙별 1인당 GDP(gdpPercap)에 따른 기대 수명(lifeExp)을 시각화해보세요.

  • 조건 1: 마커의 색상을 대륙별로 다르게 할 것 (col 속성 활용)
  • 조건 2: 우측하단(bottomright)에 범례를 표시할 것
마지막으로 업데이트 된 날짜:
2022년 9월 24일