본문 바로가기

Tableau Desktop/기타

[Tableau] 신효임 컨설턴트와 함께하는 온라인 기초 실습교육

개요

Tableau를 통해 데이터셋에서 다양한 인사이트를 발견하고, 좋은 대시보드를 개발하는 방법을 습득하기 위해 Tableau 신병 훈련소 7기(2021.03.12 ~ 2020.03.26)를 지원했습니다. 이번 포스팅에는 훈련 프로그램 시작에 앞서서 Tableau에서 제공하는 실시간 웨비나 Tableau Desktop 기초실습교육  영상 내용을 정리했습니다. 교육 영상과 동일하게 아래 순서로 내용을 정리하였습니다.

  • Tableau 및 Visual Analytics 소개
  • Tableau를 통해 데이터 전처리하기
  • Tableau를 통해 데이터 시각화 및 인사이트 찾기
  • Tableau를 통해 대시보드 공유하며 협업하기
  • 추가 리소스 안내 및 질의응답

참고한 링크는 아래와 같습니다.

 

 

본문

1. Tableau 및 Visual Analytics 소개

데이터 시각화의 필요성은 다음과 같습니다.

  • 데이터 시각화를 통해 빠르게 원하는 정보를 얻을 수 있습니다.
  • 데이터 시각화를 통해 데이터 내부에 숨겨진 패턴, 인사이트를 빠르게 얻을 수 있습니다.

 

Tableau의 미션은 다음과 같습니다.

  • We help people see and understand data -> 우리는 어떤 종류의 데이터든 사람들이 데이터를 보고 이해하는 것을 돕는다.
  • 어떤 규모의 조직이든 데이터 기반의 의사결정을 돕는다.

 

Tableau의 사용성은 다음과 같습니다.

  • Deploy
    • 온프레미스, 클라우드 환경, Tableau 자체 호스트 환경에 배포가 가능합니다.
    • Windows, Linux, Mac OS 환경에서 배포가 가능합니다.
  • Interact
    • 데스크탑, 브라우저, 모바일, 임베디드 환경에서 고객과의 상호 작용이 가능합니다.
  • 이를 위해 Tableau는 보안 및 내부 통제와 확장성 및 API를 제공합니다.

 

Tableau 제품군은 다음과 같습니다.

  • Tableau Prep Builder: 분석 및 시각화를 위한 적절한 형태의 데이터를 준비(데이터 결합, 정리, 변형, 정제)하는 프로그램입니다.
  • Tableau Desktop: 준비된 데이터를 분석 및 시각화하는 프로그램입니다. 
  • Tableau Server(사내 설치) Tableau Online(Tableau 자체 제공 프로미스 환경): 데이터 분석 및 시각화 결과를 공유하는 프로그램입니다.

 

Tableau 라이센스는 다음과 같습니다.

  • Creator 라이센스
    • Tableau Prep을 사용한 데이터 전처리
    • Tableau Desktop을 사용한 데이터 시각화
    • Tableau Online 또는 Tableau Server를 이용한 전처리 결과 및 시각화 결과 게시
    • 노트북 또는 PC에서 애플리케이션 기반으로 동작하며 웹, 모바일에서도 동작 가능합니다.
  • Viewer 라이센스
    • Tableau Online 또는 Tableau Server를 통해 게시된 뷰 또는 데이터셋을 조회, 열람할 수 있습니다.
    • 웹과 모바일 기반에서 동작 가능합니다.
  • Explorer 라이센스
    • Tableau Online 또는 Tableau Server를 통해 게시된 뷰 또는 데이터셋을 조회, 열람, 편집, 분석할 수 있습니다.
    • 웹과 모바일 기반에서 동작 가능합니다.

 

 

2. Demo 및 실습

2.1 [Demo] Tableau를 통해 데이터 전처리하기

여기서는 Tableau Prep를 사용해서 분리되어 있는 2016년~2019년 영업실적 데이터를 한 개로 합치고, 추가 데이터를 JOIN 작업을 통해 데이터 분석 및 시각화를 위한 준비를 합니다. -> 강의에서 제공한 데이터셋은 전처리가 완료된 한 개의 데이터셋을 제공받았기 때문에 아래 전처리 과정의 이미지들은 강의 영상에서 캡처한 것입니다. 

 

데이터 전처리 수행 절차는 아래와 같습니다.

  • 1. 2016년~2019년 영업실적 데이터를 차례대로 행에 붙여서 한 개 데이터로 만듭니다. -> UNION

 

  • 2. 위에서 생성한 데이터 열에 지역별 관리자 데이터를 붙입니다. -> JOIN

 

  • 3. 위에서 생성한 데이터 열에 반품 데이터를 붙입니다. -> JOIN

 

Tableau Prep을 이용한 전처리 수행

1. 2016년~2019년 영업실적 데이터 행으로 붙이기

2016년~2019년 영업실적 데이터(영업실적_2016.xlsx, 영업실적_2017.xlsx, 영업실적_2018.xlsx, 영업실적_2019.xlsx)를 차례대로 행에 붙여서 한 개 .xlsx 파일로 만듭니다. (UNION)

 

  • 결과
    • 2016년~2018년 영업 실적 데이터는 필드명으로 '할인율', '수익'을 사용하는 반면에 2019년 영업실적 데이터는 '할인', '이익'으로 필드명을 사용합니다.

 

따라서 2019년 영업실적 데이터의 필드명도 '할인율', '수익'으로 변경합니다.

  • 일치하지 않은 필드명 표시 체크
    • 일치하지 않는 2019년의 '할인', '이익' 필드를 확인할 수 있습니다.
  • 2019년도 할인 필드 드래그 -> 할인율 필드로 드롭
  • 2019년도 이익 필드 드래그 -> 수익 필드로 드롭

 

 

 

2. 지역별 관리자 데이터 열에 붙이기

위에서 생성한 데이터(유니온 1) 열에 지역별 관리자 데이터(지역별 관리자.xlsx)를 붙입니다. (JOIN)

 

  • 결과
    • 유니온 1 데이터의 지역 필드와 지역별 관리자 데이터의 지역 필드를 기준으로 JOIN을 수행했습니다.
    • 유니온 1 데이터와 지역별 관리자 데이터의 지역 필드에 공통으로 존재하는 항목만 포함시켰습니다. (INNER JOIN)
    • 유니온 1 데이터는 1,832건의 데이터를 제외한 9,168건의 데이터가 포함되었고, 지역별 관리자 데이터에서는 5건의 데이터가 모두 포함되었습니다.

 

유니온 1 데이터의 지역 필드에서 1,832건의 항목이 제외된 이유는 다음과 같습니다.

  • 유니온 1 데이터의 지역 필드에 존재하는 서울경기 항목은 지역별 관리자 데이터의 지역 필드에는 존재하지 않기 때문에 INNER JOIN 수행 시에 제외됩니다.

 

이제 서울경기 항목이 어디에 존재하는 데이터셋을 분석합니다.

  • 유니온 1 우측 + 클릭 -> 정리 단계

 

  • 정리 단계 창 -> 지역 입력
    • 서울경기 항목의 건수가 INNER JOIN 시 제외된 1,832건과 동일한 것을 알 수 있습니다. -> 즉, 유니온 1 데이터의 서울경기 항목이 INNER JOIN 시에 모두 제외되었음을 알 수 있습니다!

 

  • 서울경기 클릭 -> 입력창 지우기
    • 서울경기 데이터가 영업 실적 2019년.xlsx 파일에만 존재하는 것을 확인할 수 있습니다.
    • 결론
      • 2019년부터 영업 실적 데이터를 작성할 때, 필드명을 변경하였고(할인, 이익), 서울경기 항목을 사용했음을 알 수 있습니다. 

 

서울경기는 2016~2018년 영업 실적 데이터에서 사용한 수도권으로 이름을 변경할 수 있습니다.

  • 정리 단계 창 -> 지역 입력
  • 서울경기, 수도권 동시 선택 -> 수도권 우클릭 -> 그룹

 

3. 반품 데이터 열에 붙이기

위에서 생성한 데이터(조인 1) 열에 반품 데이터를 붙입니다. (JOIN)

 

 

  • 결과
    • 조인 1 데이터의 주문 번호 필드와 반품 데이터의 주문 번호 필드를 기준으로 JOIN을 수행했습니다.
    • 조인 1 데이터와 반품 데이터의 주번 번호 필드에 공통으로 존재하는 항목만 포함시켰습니다. (INNER JOIN)
    • 조인 1 데이터는 무려 10,214건의 데이터를 제외한 786건의 데이터만 포함되었고, 반품 데이터에서는 296건의 데이터가 모두 포함되었습니다.

 

조인 1 데이터 주문 번호 필드에서 10,214건의 항목이 제외된 이유는 다음과 같습니다.

  • JOIN을 수행한 반품 데이터의 주문 번호 필드에는 반품 처리된 주문 번호만 존재하기 때문입니다.
  • 즉, 아래 이미지의 조인 1 데이터의 제외된 10,214건의 빨간색 주문 번호는 반품되지 않은 주문 번호입니다!

 

하지만 조인 1 데이터에 존재하는 모든 주문 번호에 대한 반품 여부가 필요합니다. 이를 위해 LEFT JOIN 방식으로 변경합니다. 

  • 조인 유형 집합 -> 조인 1 클릭
  • 결과
    • LEFT JOIN을 수행합니다.
    • 조인 1 데이터 주문 번호 필드 11,000건 데이터에 반품 정보가 추가됩니다.
      • 반품 데이터에 존재하는 주문 번호 -> "YES"
      • 반품 데이터에 존재하지 않는 주문 번호 -> NULL

 

 


(참고) 만약 반품되지 않은 데이터만 가지고 분석하기 위해서는 leftOnly JOIN을 수행합니다.

  • 반품 데이터셋은 반품된 주문 번호 항목만 존재하기 때문입니다. 
  • 조인 유형의 집합 -> 조인 1만 클릭합니다. 
  • 결과
    • 조인 1에서 반품되지 않은 데이터 10,214건만 포함됩니다.


마지막으로, 최종 전처리를 완료한 데이터를 확인합니다.

  • 조인 2 우측 + 클릭 -> 정리 단계

 

  • JOIN을 수행하면서 생성된 필요 없는 지역-1, 주문 번호-1 필드를 제거합니다.

 

  • 최종 정제한 데이터의 각 필드 유형을 변경하거나, 필터, 정리, 값 그룹화, 값 분할, 계산된 필드 생성 등을 수행할 수 있습니다.

 

최종 데이터는 아래와 같습니다.

 

4. 최종 데이터 저장

마지막으로, 최종 전처리를 완료한 데이터를 저장하는 단계입니다.

  • 정리 2 우측 + 클릭 -> 출력

 

데이터 저장 방식은 크게 2가지가 있습니다.

  • (방법 1) 파일로 저장
    • 파일로 저장할 수 있는 확장자는 3가지입니다.
      • .hyper: Tableau 신버전에서 사용하는 메모리 기반의 데이터 저장 파일 파일 확장자 (Tableau 추출 파일 확장자)
        • (cf) .tds: Tableau 데이터 원본 파일 확장자
          • 자주 사용하는 원본 데이터에 빠르게 연결하기 위한 바로가기
          • 실제 데이터가 아닌, 실제 데이터에 연결하는 데 필요한 정보와 기본 속성 변경, 계산된 필드 만들기, 그룹 추가 등 실제 데이터를 기반으로 수행한 모든 수정 내용 포함!
      • .tde: Tableau 구버전에서 사용했던 메모리 기반의 데이터 저장 파일 확장자 (Tableau 추출 파일 확장자)
      • .csv: 콤마(,) 기반으로 분할된 파일 확장자

 

  • (방법 2) 데이터 원본으로 게시
    • 데이터를 서버에 게시하여 다른 사용자들과 공유할 수 있습니다.

 

2.2 [실습] Tableau를 통해 데이터 시각화 및 인사이트 찾기

여기서는 제품별, 지역별, 시계열 분석을 통한 수익성 파악하는 내용을 정리하였습니다.

 

분석 데이터 연결

분석 데이터는 제공받은 2020_test_drive_data.xlsx 파일입니다. 해당 .xlsx 파일에는 주문 데이터와 반품 데이터가 두 개 시트로 분리되어 있습니다. 따라서 최초 Tableau를 실행한 이후에 데이터 준비 창에서두 개 데이터의 주문 번호 필드를 기준으로 LEFT JOIN을 수행합니다.

 


(참고) 데이터 준비 창의 2가지 연결 옵션

  • 라이브
    • 실시간으로 DB에 쿼리를 날립니다 -> 데이터 변경에 따라 즉각 반영됩니다.
    • DB 성능이 좋아서 속도가 빠른 경우에는 라이브 방식을 사용합니다.
  • 추출 -> 강의에서 사용
    • 원본 DB를 복제하여 해당 DB 복제본에 쿼리를 날립니다. -> 새로고침 시에 실제 DB에 반영됩니다.
    • 무거운 DB를 사용하는 경우에 사용합니다. -> 무거운 DB 원본에 지속해서 쿼리를 날리면, 메모리 부하가 커지기 때문입니다.
    • DB 성능이 나쁜 경우에는 추출 방식을 사용합니다. 

 

 


 

연결 옵션을 '추출'로 선택한 이후에 좌측 하단 시트 1을 클릭하면, 분석 데이터를 .hyper 확장자로 저장합니다. -> Tableau가 메모리에서 데이터를 처리하도록 합니다.

 

어떤 제품의 실적이 안 좋은가? 

최초 데이터 패널을 확인하면, 하단 좌측 이미지와 같이 반품 데이터와 주문 데이터로 따로 분리되어 있습니다. 우리는 이 2개 데이터를 1개 데이터로 JOIN을 수행했으므로, 1개 폴더로 합칩니다. 

  • 데이터 패널 아래 화살표 -> 폴더별 그룹화 선택

또한, 각 필드들이 특성에 따라 차원과 측정값으로 올바로 분리된 것을 확인할 수 있습니다.

 

다음으로, 공통 정보를 가진 여러 개의 필드를 1개 폴더로 그룹핑하거나 계층적 의미를 가진 여러 개의 필드를 1개 계층 구조로 만들어서 필드 정보를 보기 좋게 만듭니다. -> 이는 데이터셋이 많은 필드를 포함하고 있을 때, 간소화해서 볼 수 있는 장점이 있고, Tableau Server에 올리서 게시할 때, 다른 사람이 한눈에 알아보기 쉽습니다.

  • 고객이라는 공통 정보를 가진 고객 세그먼트, 고객명, 고객번호, 고유 id 필드를 1개 폴더로 그룹핑합니다. 

 

이제 첫 번째 절차로 제품 대분류 별 매출 및 수익 현황을 확인합니다.

  • 전체 매출 합계는 사무기기, 가구, 사무용품 순으로 큽니다.
  • 사무기기와 가구는 매출 합계(바 차트 길이)는 비슷하지만, 수익 합계(바 차트 색상)는 사무기기가 가구에 비해 월등히 크다는 것을 알 수 있습니다.

 

다음으로, 제품 중분류 레벨로 분기했을 때의 매출 및 수익 현황을 확인합니다.

  • 탁자 수익이 눈에 띄게 문제가 있음을 확인할 수 있습니다.

 

특별히, 제품 대분류, 제품 중분류, 제품명 필드는 계층적 의미를 가지고 있으므로, 자유롭게 drill down을 수행하고 데이터 패널의 필드를 간소화하기 위해 1개 계층 구조로 만듭니다.

 

탁자의 수익성 문제가 발생한 지역을 파악하기 위해 지역 필드를 행 선반에 올려서 분기를 추가합니다.

 

행의 가장 바깥쪽 항목 개수가 열의 가장 바깥쪽 항목 개수보다 많은 경우에는 행과 열을 바꿔서 가로

형태의 바 차트가 읽기 편합니다.

  • 호남 지역을 제외한 모든 지역에서 탁자의 수익 합계가 (-) 값으로 문제가 있음을 알 수 있습니다.

 

이번에는 탁자의 수익성 문제가 발생한 고객을 분석하기 위해 고객 세그먼트 필드를 행 선반에 올립니다.

  • 선반에 올린 차원이 많아져서 다소 복잡해 보입니다.

 

이때 필터 마크를 사용하면 간편하게 고객 세그먼트 항목별로 결과를 확인할 수 있습니다.

  • 고객 세그먼트 필드를 필터 마크에 올립니다.
  • 필터 표시를 선택하고
  • 결과
    • 고객 세그먼트 항목별로 마우스를 클릭할 때마다 결과를 확인할 수 있도록 합니다.

 

최종 결론

  • 탁자가 수익성에 문제가 있음을 알 수 있습니다.

 

 

수익성의 지역별 패턴을 확인할 수 있을까? 

이제 탁자의 수익 문제가 발생한 지역을 좀 더 구체적으로 확인합니다.

  • Tableau 지도 시각화를 활용하기 위해 국가, 지역, 시도, 시군구 필드에 각각 지리적 역할을 부여합니다.
  • 지리적 역할이 부여된 위 필드들은 행정구역 계층의 의미를 가지므로, 1개 계층 구조로 만듭니다.

 

국가, 지역, 시도, 시군구, 수익, 매출을 마크 카드에 올리고, 제품 중분류 필드를 필터 카드에 올려서 탁자로 필터링을 수행합니다.

  • 탁자의 수익성이 나쁜 지역은 대표적으로 경기도 안산시인 것을 확인할 수 있습니다.

 

  • 시도 기준으로 확인하면, 수도권에서 탁자의 매출은 크지만, 수익성은 나쁜 것을 알 수 있습니다.

 


(참고) 다중 값(목록) 필터는 다른 항목을 체크할 때마다 시각화 결과가 지워졌다가 다시 그려집니다. -> 사이즈가 큰 데이터를 사용하면 다시 그려지는 시간이 오래 걸립니다.  

 

이를 해결하기 위해 적용 단추 표시 기능을 사용합니다.

  • 다중 값(목록) 필터 아래 세모 옵션 -> 사용자 지정 -> 적용 단추 표시 선택

 

  • 결과
    • 하단 우측 이미지와 같이 적용 버튼이 생성됩니다.
    • 항목을 체크한 후, 적용 버튼을 누르면 뷰에 결과가 반영이 됩니다.
      • 즉, 항목을 체크할 때 결과를 저장하고 있다가 적용 버튼을 누르면 곧바로 결과를 표현하는 방식 같습니다. 

 


 

최종 결론

  • 탁자의 수익성 문제는 특정 지역이 아닌, 전국적으로 발생한 문제입니다.

 

 

언제부터 문제가 있었을까? 

이제 탁자의 수익이 나빠진 시기를 구체적으로 확인합니다. 먼저, 월별 매출 합계와 수익 합계를 라인 차트로 확인합니다.

 

연도별로 수익 합계누적해서 표현합니다.

  • 합계(수익) 아래 세모 -> 퀵 테이블 계산 -> 누적

 

좀 더 명확하게 연도별 수익 합계의 누적 값을 확인합니다.

  • 합계(수익) 우클릭 -> 테이블 계산 편집
  • 기본적으로 전체 데이터를 기준으로(테이블(옆으로) 누적을 계산합니다.
  • 여기서는 각 연도별로 누적을 계산하기 위해 패널(옆으로)을 선택합니다.

 

일반적으로 누적 값은 라인 차트 대신에 영역 차트로 표현합니다.

 

최종 결론

  • 탁자의 수익성 문제는 최근에 발생한 문제가 아닌, 과거부터 지속해서 발생한 문제임을 알 수 있습니다.

 

 

모아서 보면 또 다른 것이 보일까?

마지막으로, 지금까지 작업한 제품별 수익성, 지역별 수익성, 시계열 분석 워크 시트를 한 개 대시보드로 만듭니다.

 

고객 세그먼트 항목에 따른 지역별 수익성, 시계열 분석을 확인하기 위해 제품별 수익성 워크 시트에만 적용되어 있는 고객 세그먼트 필터를 지역별 수익성 및 시계열 분석 워크 시트에도 적용합니다.

  • 고객 세그먼트 필터 아래 세모 옵션 -> 워크시트에 적용 -> 선택한 워크시트 -> 지역별 수익성 및 시계열 분석 워크시트 체크

 

  • 결과
    • 고객 세그먼트 필터에서 항목을 선택함에 따라 모든 워크시트에 결과가 반영됩니다. 

 

 

마지막으로, 고객 세그먼트 별 탁자의 수익성 정보를 확인합니다.

  • 제품별 수익성 워크시트에서 탁자를 클릭합니다.

전체 고객

  • 고객 세그먼트 필터에서 (전체)를 선택합니다.
  • 결과
    • 2017년을 제외하면 매년 하반기로 갈수록 누적 수익이 감소합니다. 

 

 

기업 고객

  • 고객 세그먼트 필터에서 기업 고객을 선택합니다.
  • 결과
    • 전체 고객과 마찬가지로 2017년를 제외하면 매년 하반기로 갈수록 누적 수익이 감소합니다. 

 

 

소비자

  • 고객 세그먼트 필터에서 소비자를 선택합니다.
  • 결과
    • 전체 고객과 마찬가지로 2017년를 제외하면 매년 하반기로 갈수록 누적 수익이 감소합니다. 

 

홈 오피스

  • 고객 세그먼트 필터에서 소비자를 선택합니다.
  • 결과
    • 다른 항목과는 다르게 2019년도에 수익성 개선이 이뤄졌음을 알 수 있습니다.

 


(참고) 지도 시각화에서 줌인/줌아웃

  • 마우스 휠로 수행

(참고) 지도 시각화에서 이동하는 방법

  • 가장 마지막 옵션 -> 이동을 선택한 후에 마우스 드래그로 이동할 수 있습니다.


 

최종 결론

  • 최근 2019년에는 홈 오피스 고객탁자의 수익성이 개선됐음을 알 수 있습니다.

 

 

2.3 [Demo] Tableau를 통해 대시보드 공유하며 협업하기

2.3.1 다른 사람들도 볼 수 있게 서버에 게시해 보자

Tableau에서 완성한 대시보드를 서버에 게시하여 공유합니다.

  • 메뉴 탭 -> 서버 -> 로그인 확인 -> 통합 문서 게시 (데스크탑 버전에서만 사용 가능)

 

  • 1) 시트
    • 서버에 게시할 시트를 선택합니다. -> 여기서는 최종 수익성 대시보드만 서버에 게시합니다.

 

  • 2) 데이터 원본 설정
    • 통합 문서에 내장됨
      • 현재 Tableau 통합 문서에서 사용한 데이터셋을 내장하여 게시합니다.
      • 따라서 데이터셋은 현재 Tableau 통합 문서에서만 사용할 수 있습니다.
    • 별도로 게시
      • 현재 Tableau 통합 문서와 사용한 데이터셋을 따로 분리하여 게시합니다.
      • 따라서 데이터셋만 따로 가져와서 분석에 사용할 수 있습니다.
      • 여기서는 별도로 게시를 선택합니다.

 

  • 결과
    • 게시한 대시보드를 웹 브라우저 상으로 확인할 수 있습니다.
    • 게시된 대시보드를 Tableau Viewer, Tableau Explorer 라이센스를 통해 확인하거나 편집을 수행할 수 있습니다.

 

해당 웹 브라우저 상단에 존재하는 메뉴를 확인합니다.

  • 데이터 세부 정보
    • 이 대시보드의 뷰: 현재 대시보드의 조회수 변화를 확인할 수 있습니다.
    • 대시보드 개발자 및 날짜 정보를 알 수 있습니다.
    • 대시보드 개발에 사용한 데이터 정보를 알 수 있습니다.
    • 대시보드 개발에 사용한 필드 정보를 알 수 있습니다.

 

  • 데이터에 질문
    • 게시한 데이터셋에 대한 질문을 입력하면, 자연어 처리(NLP) 모델을 통해 해당 질문에 대한 답변을 시각화 결과를 보여주는 기능입니다.

 

  • 뷰: 원본
    • 자신만의 뷰를 만들 수 있습니다.

 

  • 알림
    • 특정 필드(?) 데이터의 임계값 조건을 설정하고, 실시간으로 데이터를 수집하여(?) 조건을 만족하면 특정 시간 간격으로 이메일을 받을 수 있습니다.

 

  • 구독
    • 자신 또는 특정 누군가에게 특정 시간마다 대시보드를 보낼 수 있는 기능입니다.

 

  • 공유
    • 대시보드 웹 사이트 URL을 공유할 수 있습니다.
    • 웹 사이트 내장 자바스크립트 코드를 그대로 복사하는 것도 가능합니다.

 

  • 다운로드
    • 파일 형식을 지정하여 대시보드를 다운로드할 수 있습니다.
    • 이미지, 데이터, 크로스탭, PDF, PowerPoint, Tableau 패키지 통합 문서(.twbx 파일)
    • (참고) Tableau 통합문서
      • .twbx (Tableau 패키지 통합 문서)
        • Tableau 워크 시트 + 연결한 데이터셋(라이브 또는 추출 방식 상관없음)내장한 파일
        • .twbx는 여러개의 데이터셋 중에 일부만 내장하는 경우도 있습니다. -> 이렇게 내장되지 않은 데이터셋 원본은 .twbx에서도 확인할 수 없습니다.
        • 따라서 .twbx가 내장한 데이터를 확인하기 위해서는 패키지 해제를 수행해야 합니다.
          • (step 1) .twbx 파일 우클릭 -> 패키지 해제
          • (step 2)
            • 내장된 데이터 경로: .twb Files\Data\..
            • (추가) 내장된 이미지 경로: .twb Files\Image\..
            • 참고로, 위 이미지 Extract 파일은 Raw Data(.xlsx, .csv 등)을 Join 등을 수행한 파일일 수 있습니다!! --> 실무에서 데이터 수정등이 발생할 수 있기 때문에 원본 Raw Data(.xlsx, .csv 등)가 필요한 이유입니다.
        • (참고) Tableau public에 저장시에 .twbx 확장자로 저장됩니다!
      • .twb (Tableau 통합 문서)
        • Tableau 워크 시트만 저장한 파일
        • .twb로 저장된 파일을 공유할 경우에는 사용한 데이터셋 파일을 함께 공유해야 합니다!

 

  • 편집
    • 데이터셋을 가지고 웹 상에서 추가적으로 분석할 수 있는 기능
    • Tableau 데스크탑의 기능의 90% 정도만 사용할 수 있습니다.

 


(참고) Tableau에서 워드 클라우드(word cloud) 시각화

  • 마크 카드 -> 텍스트
  • 하단 이미지는 제품 중분류 항목 별 매출 합계 및 수익 합계를 워드 클라우드(word cloud)로 시각화한 결과입니다.


 

3. 추가 리소스 안내 및 질의응답

3.1 Tableau 시작 키트

www.tableau.com/ko-kr/learn/starter-kits

 

3.2 Tableau 실시간 교육 리소스

www.tableau.com/ko-kr/learn/live-training-resources

 

3.3 웹 세미나 시리즈(대한민국)

www.tableau.com/ko-kr/learn/series/webinars

 

3.4 Tableau Public

Tableau Public 등을 참고하여 상대방이 만든 .twbx 파일을 열어서 워크시트를 확인할 수 있습니다!

  • 대시보드 -> 워크시트 클릭 -> 시트로 이동

 

 

마무리

이번 포스팅에서는 왜 데이터 시각화가 필요한지와 Tableau의 미션, 사용성, 다양한 제품군 및 라이센스 관련 내용을 정리하였습니다. 또한, Tableau Prep을 사용하여 데이터 분석 및 시각화를 위한 데이터 전처리를 수행하였고, Tableau를 사용하여 전처리한 데이터를 시각화하며 다양한 인사이트를 도출했습니다. 마지막으로, 만들어진 대시보드를 서버에 게시하고, 게시된 웹 브라우저에서 할 수 있는 다양한 기능을 정리하였습니다. 

 

좋은 세미나 내용을 제공해주신 신효임 컨설턴트님께 감사의 말씀을 드리고 싶습니다. 

감사합니다 :)