Chapter 02
태블로 제품군 이해
- 태블로 데스크탑 (Tableau Desktop)
- 프로페셔널 에디션: 유료 버전, 데이터 분석 및 시각화 기능 제공
- 퍼블릭 에디션: 무료 버전, 기본적인 데이터 분석 및 시각화 기능 제공, 온라인 공유 기능 제한
- 태블로 서버/클라우드 (Tableau Server/Cloud): 분석 결과 공유 및 협업 기능 제공
- 태블로 프렙 빌더 (Tableau Prep Builder): 데이터 정제 및 준비 도구
- 태블로 리더 (Tableau Reader): 분석 결과 보기 전용 도구
태블로 데스크탑 설치 및 인터페이스 소개
- 설치: 태블로 웹사이트에서 데스크탑 버전 다운로드 후 설치
- 인터페이스:
- 데이터 연결창: 다양한 데이터 원본에 연결
- 데이터 준비창: 데이터 정제 및 준비
- 데이터 작업창: 데이터 시각화 및 분석
태블로 vs. 엑셀
- 데이터 시각화: 태블로는 그래프 중심, 엑셀은 표 중심
- 데이터 편집: 태블로는 데이터 원본 편집 불가, 엑셀은 편집 가능
- 계산 방식: 태블로는 측정값 집계, 엑셀은 측정값 있는 그대로
Chapter 03
데이터 시각화 기본 차트 따라 그리기
- 바 차트: 측정값 더블클릭, 분기할 차원 더블클릭, 행/열 바꾸기, 마크 레이블 표시
- 라인 차트: 측정값 더블클릭, 날짜 차원 더블클릭, 마크 레이블 표시, 드릴 다운/업, 연속형/불연속형 날짜
- 파이 차트: 측정값 더블클릭, 차원을 색상으로 이동, 마크 카드에서 파이 차트 선택, 측정값을 각도로 이동, 마크 레이블 표시, 퀵 테이블 계산
마크 카드 활용
- 차트 타입 변경
- 화면 분기 및 레이블, 크기, 색상으로 구분
- 도구 설명 추가
파이 차트의 단점
- 각도 인지 어려움
- 크기 비교 어려움
파이 차트 대안
- 바 차트
- 트리맵
- 도넛 차트
Chapter 04
스캐터 플롯
- 두 측정값 더블클릭
- 행/열 바꾸기
- 차원을 세부 정보에 드래그 앤 드롭
- 추세선 추가
박스 플롯
- 측정값 더블클릭
- 차원을 세부 정보에 드래그 앤 드롭
- 마크 카드에서 원형으로 변경
- 박스 플롯 추가
- 원 크기 조정
히스토그램
- 측정값 우클릭, 구간 차원 생성
- 구간 차원을 열 선반에 드래그 앤 드롭
- 차원을 행 선반에 드래그 앤 드롭, 카운트(고유) 선택
- 구간 차원을 연속형으로 변환
하이라이트 테이블
- 차원을 행/열 선반에 드래그 앤 드롭
- 측정값을 레이블에 드래그 앤 드롭
- 측정값을 색상에 드래그 앤 드롭
- 차트 유형을 사각형으로 변경
Chapter 05
차원과 측정값
- 측정값: 분석 대상
- 차원: 측정값을 썰어보는 기준
연속형과 불연속형
- 연속형: 쭉 이어진 것 (초록색)
- 불연속형: 잘려서 구분되는 것 (파란색)
Level of Detail (LOD)
- 태블로는 항상 집계
- 화면 제작 시 데이터의 디테일 수준 결정 중요
계산 방법
- 행 수준 계산
- 집계 계산
- 테이블 계산: 집계 계산 후 추가 계산
- LOD 표현식: 다른 수준에서 집계 계산
Chapter 07
데이터 결합
- 태블로 데스크탑 vs. 태블로 프렙
- 태블로 프렙에서 데이터 정제 후 데스크탑에서 사용 권장
- 데이터 결합 방식
- 유니온: 세로 결합
- 조인: 강력한 가로 결합, 키 필드 필요
- 관계: 유연한 결합, 키 필드 필요
- 블렌딩: 임시적인 결합, 필요에 따라 사용
Chapter 08
필터
- 필터 개념: 세부적, 집중적 관찰
- 필터 중요성: 태블로 본질과 관련, 스토리텔링 가능, Order of Operations 핵심 요소
- 필터 종류
- 추출 필터: 추출 데이터 범위 조정
- 데이터 원본 필터: 분석 데이터 범위 조정
- 컨텍스트 필터: 작동 우선순위 변경
- 차원 필터: 데이터 탐색 시 활용
- 측정값 필터: 적용 방식에 따라 의미 다름
- 테이블 계산 필터: 테이블 계산 결과 필터링
- 숨기기: 특정 데이터 제외
Chapter 09
이중 축
- 정의: 2개의 축, 하나의 가로축에 두 개의 측정값 표현
- 의미: 비교 맥락 만들기, 스토리텔링 가능
- Bar-in-Bar 차트: 두 측정값을 막대로 표현, 축 동기화
- 디자인 요소 추가: 라인, 막대 등 다양한 디자인 활용
- 이중 축 vs. 결합 축
- 이중 축: 2개 축 생성, 2개 마크 카드, 자유도 높음, 2개 측정값
- 결합 축: 1개 축 공유, 1개 마크 카드, 자유도 낮음, 3개 이상 측정값
도넛 차트
- 파이 차트 단점 보완
- 이중 축 활용, 가운데 빈 공간
- 두 가지 항목 비교에 유용
Chapter 10
분석 패널
- 데이터 시각화 고도화 기능
- 보조선: 추세선, 상수 라인, 평균 라인, 참조선 등
- 알고리즘: 클러스터링, 예측 등
보조선 활용
- 데이터 의미 명확히 표현
- 참조선: 맥락 이해 위한 값 제공
- 평균 vs. 총계: 계산 방식 다름
알고리즘 활용
- 클러스터링: 고객 분류 등
- 예측: 네이버 주가 예측 등
Chapter 11
지도 시각화
- 태블로 지도 활용: 공간 분석, BI 도구
- 지도 시각화 장단점
- 장점: 공간적 맥락 표현
- 단점: 잘못 활용 시 의미 왜곡 가능
지리경계 구역 표현
- 지리경계정보 필요: shp, geojson, kmz 등
- 지리적 역할 활용: 쉽고 간편
- 좌표 표현: 지리적 역할, MAKEPOINT 함수
- 지오코딩: 주소를 좌표로 변환
Chapter 13
대시보드
- 정의: 시트, 개체, 동작 조합, 정보 종합 상황판
- 구성 요소
- 시트: 정보 담당
- 개체: 의미 구체화, UI/UX 요소
- 동작:
'데이터 분석 부트캠프 > 주간학습일지' 카테고리의 다른 글
[패스트캠퍼스] 데이터 분석 부트캠프 16기 12주차 - 생성형 AI 활용 (3) | 2024.11.07 |
---|---|
[패스트캠퍼스] 데이터 분석 부트캠프 16기 9주차 - SQL 문법 (2) | 2024.10.18 |
[패스트캠퍼스] 데이터 분석 부트캠프 16기 8주차 - SQL 기본 이론 (3) | 2024.10.11 |
[패스트캠퍼스] 데이터 분석 부트캠프 16기 5주차 - Python을 활용한 데이터 시각화 (NumPy / Pandas / MatPlotLib / Seaborn) (3) | 2024.09.20 |
[패스트캠퍼스] 데이터 분석 부트캠프 16기 4주차 - Python의 Selenium을 활용한 데이터 크롤링 (6) | 2024.09.13 |