본문 바로가기

Tableau Desktop/[인프런] 웰컴 투 태블로 월드

[인프런] 웰컴 투 태블로 월드 - 3-3. 태블로의 주요 기능 익히기(지도)

개요

지난 포스팅에서는 Tableau의 분석 패널(Analytics Rane)의 상수 라인, 평균 라인, 총계, 추세선, 예측, 클러스터링, 참조선을 시각화하는 방법을 정리했었습니다.

이번 포스팅은 [인프런] 웰컴 투 태블로 월드 강의 네 번째 '태블로의 주요 기능 익히기' 섹션 중에 지도관련된 내용을 아래 순서대로 정리하였습니다.

  • 시도 및 시군구 화면 만들기
  • 필드 계층 만들기
  • 마크 카드 밀도로 지도 시각화
  • 지도 시각화의 강점과 약점

 

참고한 링크는 아래와 같습니다.

 

본문

Tableau의 지도는 데이터에 공간적 맥락을 부여함으로써 BI 리포트를 풍성하게 만들어주는 장점이 있습니다. 특별히, 이번 글에서는 대한민국 지도를 토대로 데이터 시각화를 수행하기 위해 한국 버전 Sample - Superstore 데이터셋인 Superstore KR - VizLab 2021.xlsx(원작 - 태블로 코리아 우재하 이사 / 수정 - VizLab)을 사용합니다. (참고: 강의에서는 Superstore KR v2017 데이터셋 사용)

 

1. 시도 및 시군구 화면 만들기

Tableau에서 지도 화면에 시/도, 시/군/구를 표현하기 위해서는 지리적 타입의 행정구역 명칭 데이터가 필요합니다. 우리가 사용하는 Superstore KR - VizLab 2021 데이터셋은 광역 지자체명(도, 특별시, 광역시) 및 기초 지자체명(시, 군, 구) 필드를 포함하고 있습니다.

 

최초 데이터셋을 연결하면 지자체명 필드를 문자열 타입으로 인식하는데, 먼저 광역 지자체명(도, 특별시, 광역시)이 저장된 Address SD 필드를 지리적 타입으로 변경합니다.

  • Address SD 필드명 앞 Abc 기호 클릭 -> 지리적 역할 -> 시/도
    • Address SD 필드가 지리적 타입(지구본 기호)으로 변경됩니다.

 

마찬가지로, 문자열 타입으로 인식한 기초 지자체명(시, 군, 구)이 저장된 Address SGG 필드를 지리적 타입으로 변경합니다. 

  • Address SGG 필드명 앞 Abc 기호 클릭 -> 지리적 역할 -> 카운티
    • Address SGG 필드가 지리적 타입(지구본 기호)로 변경됩니다.

 

Tableau는 기본적으로 대한민국 17개의 광역 지자체와 226개의 기초 지자체(2021년 1월 기준)의 경계 정보를 가지고 있습니다. 해당 명칭을 가진 데이터가 존재하면, 손쉽게 지도 화면을 만들 수 있습니다.

  • Address SD 필드를 마크 카드 세부정보에 올립니다.
    • 17개 광역 지자체가 지도에 표현됩니다.

 

  • Address SGG 필드를 마크 카드 세부 정보에 올립니다.
    • 229개초 지자체가 지도에 표현됩니다.
    • (참고) 사실 공식적인 기초 지자체는 제주특별자치도 - 제주시, 제주특별자치도 - 서귀포시, 세종특별자치시 3개를 제외한 226개입니다. 하지만 전국 단위 비교의 편의를 위해 229개로 적용된 것 같습니다. (링크 각주 참고)

 

마크 카드의 마크를 방식으로 변경합니다.

  • 기초 지자체의 지리적 경계를 구분해서 확인할 수 있습니다.

 

기초 지차체 별 수익 합계를 색상으로 확인합니다.

  • Profit 측정값을 마크 카드 색상에 올립니다.
  • 결과
    • 경상북도 안동시의 Profit 합계가 가장 저조함을 알 수 있습니다.

 

2. 필드 계층 만들기

이번에는 기초 지자체명을 가진 Address SGG 필드만 마크카드 세부 정보에 올립니다.

  • 화면 우측 하단에서 7개의 알 수 없는 항목을 확인할 수 있습니다.
    • 강서구, 고성군, 남구, 동구, 북구, 서구, 중구는 전국에 2개 이상 존재하는 지자체입니다. 때문에 Tableau가 정확한 위치를 판단할 수 없는 것입니다!

 

  • 해결책
    • 1) 상위 행정 구역인 광역 지자체명을 가진 Address SD 필드를 먼저 마크 카드에 올려서 분기시킨 후에 기초 지자체명을 가진 Address SGG 필드를 올립니다.
    • 2) 광역 지자체 Address SD 필드와 기초 지차체 Address SGG 필드를 계층 구조로 만듭니다.
      • Address SGG 필드 드래그 -> Address SD 필드 위로 드롭 -> 계층 만들기 -> 계층 이름을 'Address SD - SGG'로 설정
      • 결과
        • 새로운 계층구조 필드 Address SD - SGG가 생성되고, 내부에 Address SD 필드, Address SGG 필드를 확인할 수 있습니다.
        • 생성한 Address SD - SGG 계층 필드를 마크카드 세부 정보에 올리면, 최초 상위 행정 구역을 가진 Address SD가 올라가고, 이를 drill down 하여 하위 행정 구역 Address SGG 필드의 시각화 결과를 확인할 수 있습니다.
        • 데이터셋이 여러개의 지역명 필드를 가지고 있으면, 계층 구조를 먼저 만든 이후에 시각화를 수행합니다!

 

또한, Address Region 필드 정보를 확인하면, 아래와 같이 6개의 멤버가 존재하는 것을 확인할 수 있습니다. 이는 광역 지자체(특별시, 광역시) 보다 상위 행정구역임을 알 수 있습니다. 즉, Address Region 필드도 Address SD - SGG 계층 구조로 적용할 수 있습니다!

 

먼저, 문자열 타입의 Address Region을 지리적 타입으로 변경한 후, 광역 지자체 Address SD 필드의 상위 필드로 설정합니다.

  • Address Region 필드명 앞 Abc 기호 클릭 -> 지리적 역할 -> 만들기 원본 -> Address SD
    • Address Region 필드 데이터는 지리적 역할 메뉴에 해당하는 선택지가 없으므로, 만들기 원본을 선택하고, Address SD 필드보다 상위로 위치하도록 해당 필드를 선택합니다.

 

  • 결과
    • Address Region 필드가 Address SD - SGG 계층의 최상위 필드가 되며, 이를 마크 카드 세부정보에 올린 후 drill down을 통해 기초 지자체 행정구역까지 시각화할 수 있습니다.

 

3. 마크 카드 밀도로 지도 시각화

이번에는 마크 카드 밀도를 사용하여 지도를 시각화합니다. 밀도는 마크가 많이 존재하는 곳(많이 겹치는 곳)을 표현하며, 데이터셋에서 빈도가 많이 발생한 지역(측정값이 크거나 작은 것을 의미하는 것이 아닙니다.)을 알 수 있습니다.

  • 마크 카드 세부 정보에 Adress SD - SGG 필드를 올립니다.
  • 최대 Level of Detail까지 drill down을 수행합니다.

 

  • 마크 카드를 자동 -> 밀도로 변경합니다.
  • Sales 측정값을 마크 카드 색상에 올린 후, 차이가 뚜렷한 색상으로 변경합니다.
  • 결과
    • 서울을 비롯한 수도권 지역과 부산, 경남 지역의 Sales 합계가 두드러지게 높은 것을 알 수 있습니다.

 

4. 지도 시각화의 강점과 약점

강점

1) 눈에 잘 들어오고, 직관적입니다.

2) 데이터에 공간적 맥락을 부여합니다.

 

약점

1) 똑같은 데이터를 VLOD를 다르게 시각화하면, 인지되는 결과가 달라질 수 있습니다.

  • (ex) 행정구역 '시'별로 분기한 데이터 분포(좌측 이미지)'구/군'별로 분기(우측 이미지)하면, 적색과 파란색의 비율에 차이가 달라질 수 있습니다.

 

2) 데이터 집계 결과를 면적을 가진 지도 위에 표현하기 때문에 데이터 해석에 왜곡이 발생할 가능성이 있습니다.

  • (ex) 적색 비율이 파란색보다 압도적으로 많지만, 실제 집계 결과 수치는 파란색이 더 많을 수 있다.
    • 즉, 지도의 면적이 실제 데이터 집계 결과를 표현하는 것이 아니므로, 지도 면적만 가지고는 집계 결과를 판단할 수 없다!

 

 

마무리

이번 포스팅에서는 Tableau의 지도에 관한 내용을 정리하였습니다. Tableau가 기본적으로 가지고 있는 대한민국 17개의 광역 지자체와 226개의 기조 지자체 경계 정보를 사용하기 위해 해당 데이터를 가진 필드를 지리적 타입으로 변경해야 합니다. 또한, 상위 행정구역 필드와 하위 행정구역 필드를 계층 구조로 만들어서 시각화를 하였습니다. 다음으로, 마크 카드의 밀도를 활용하여 측정값 필드의 분포를 지도에서 확인할 수 있었습니다. 마지막으로, 지도 시각화의 강점, 약점을 살펴봤습니다.

작게나마 누군가에게 도움이 되는 글이었으면 좋겠습니다. 
감사합니다 :)