[패스트캠퍼스] 데이터 분석 부트캠프 16기 13주차 - Tableau
·
데이터 분석 부트캠프/주간학습일지
Chapter 02태블로 제품군 이해태블로 데스크탑 (Tableau Desktop)프로페셔널 에디션: 유료 버전, 데이터 분석 및 시각화 기능 제공퍼블릭 에디션: 무료 버전, 기본적인 데이터 분석 및 시각화 기능 제공, 온라인 공유 기능 제한태블로 서버/클라우드 (Tableau Server/Cloud): 분석 결과 공유 및 협업 기능 제공태블로 프렙 빌더 (Tableau Prep Builder): 데이터 정제 및 준비 도구태블로 리더 (Tableau Reader): 분석 결과 보기 전용 도구태블로 데스크탑 설치 및 인터페이스 소개설치: 태블로 웹사이트에서 데스크탑 버전 다운로드 후 설치인터페이스:데이터 연결창: 다양한 데이터 원본에 연결데이터 준비창: 데이터 정제 및 준비데이터 작업창: 데이터 시각화 및..
[패스트캠퍼스] 데이터 분석 부트캠프 16기 12주차 - 생성형 AI 활용
·
데이터 분석 부트캠프/주간학습일지
데이터 분석 기법 비교분석 기법주요 목적주요 지표/측정 방식장점단점코호트 분석특정 시점에 특정 행동을 한 그룹(코호트)의 행동 변화를 추적고객 생애주기, 리텐션율, 매출 기여도 등그룹별 행동 변화 파악 용이, 시계열 분석에 유리세분화가 잘못되면 잘못된 결론 유도 가능, 초기 데이터가 중요잔존율 분석고객이 특정 시점 이후에도 서비스를 계속 이용하는 비율 분석리텐션율, 생존율, 평균 잔존 기간고객 유지 요인 파악, 재방문 유도 전략 수립에 효과적장기적인 고객 행동 분석에 적합, 초기 지표 분석엔 다소 제한적RFM 분석고객 가치를 평가하여 마케팅 전략을 세분화최근 구매일(Recency), 구매 빈도(Frequency), 구매 금액(Monetary)간단한 점수화로 고객 분류, 고객 이탈 방지 전략에 유리시간에 ..
[패스트캠퍼스] 데이터 분석 부트캠프 16기 9주차 - SQL 문법
·
데이터 분석 부트캠프/주간학습일지
SQL DDL (Data Definition Language)DATABASECREATE DATABASE : 데이터베이스 생성CREATE DATABASE dbname;SHOW DATABASES : 데이터베이스 목록 보기SHOW DATABASES;+--------------------+| Database |+--------------------+| information_schema || mysql || performance_schema || sys |+--------------------+4 rows in set (0.00 sec)USE : 데이터베이스 사용USE dbname;DROP DATABASE : 데이터베이스 삭제IF EXISTS :..
[패스트캠퍼스] 데이터 분석 부트캠프 16기 8주차 - SQL 기본 이론
·
데이터 분석 부트캠프/주간학습일지
SQL 기본RDBMS의 개념RDBMS (관계형 데이터베이스 관리 시스템; Relational Database Management System)2차원의 테이블(table) 형식을 이용하여 데이터를 정의하고 설명하는 데이터 모델속성(attribute)과 데이터 값(value)로 구성됨데이터를 구조화한다 = 속성과 데이터 값 사이에서 관계(relation)을 찾아내고 이를 테이블 모양의 구조로 도식화주요 용어테이블 (Table) = 관계 (Relation)컬럼 (Column) = 필드 (Field) = 속성 (Attribute)로우 (Row) = 레코드 (Record) = 튜플 (Tuple)기본키 (Primary Key; PK)한 테이블의 각 로우를 유일하게 식별해주는 컬럼각 테이블마다 기본키가 존재해야 함N..
[패스트캠퍼스] 데이터 분석 부트캠프 16기 5주차 - Python을 활용한 데이터 시각화 (NumPy / Pandas / MatPlotLib / Seaborn)
·
데이터 분석 부트캠프/주간학습일지
NumPyNumeric Python의 줄임말수학/과학 연산을 위한 파이썬 패키지NumArray & Numeric 이라는 기존 파이썬 패키지를 계승함행렬 및 벡터을 사용하는 선형 대수 계산과 다차원 배열을 다룰 때 사용됨파이썬의 list와 거의 흡사하나 순수 파이썬에 비해 연산 속도가 빠름배열(array)의 종류NumPy의 자료형 : ndarrayndarray : nth dimensional array object (다차원 행렬 배열 객체)1차원 배열 : Vector (axis(축)=0 : 행)2차원 배열 : Matrix, (axis=1 : 열)3차원 배열 : Tensor, (axis=2 : 채널)ndarray의 특징 : list와 다르게 서로 다른 데이터 타입의 요소를 담을 수 없음NumPy 기본 함수생..
[패스트캠퍼스] 데이터 분석 부트캠프 16기 4주차 - Python의 Selenium을 활용한 데이터 크롤링
·
데이터 분석 부트캠프/주간학습일지
SeleniumSelenium Version : 4.24.0설치pip를 통한 selenium과 webdriver-manager 설치는 한번만pip install seleniumpip install webdriver-manager # webdriver 버전 관리 툴webdriver-manager로 ChromeDriver 설치Chrome과 ChromeDriver는 별개from webdriver_manager.chrome import ChromeDriverManagerChromeDriverManager().install()옵션값 설정from selenium import webdriveroptions = webdriver.ChromeOptions()options.add_argument('--headless') ..
[패스트캠퍼스] 데이터 분석 부트캠프 16기 3주차 - Python 제어문/예외처리/함수/변수/클래스
·
데이터 분석 부트캠프/주간학습일지
if : 조건문 (conditional statements)if : 제시한 조건이 True 일 때 실행할 코드 [조건문 첫번째 줄]elif : 제시한 조건이 True 일 때 실행할 코드 [조건문 두번째 줄 이후]else : if, elif 가 모두 False 일 때 실행할 코드 [조건문 마지막 줄]불린 입력값 사용한 조건문 예시isTrue = Falseif isTrue: print("isTrue 는 True입니다.")else: print("isTrue 는 False입니다.")# isTrue 는 False입니다. 비교 연산자 & 논리 연산자 사용한 조건문 예시if (10 > 1) and (11 == 12): print(True)else: print(False)# Falseif + el..
[패스트캠퍼스] 데이터 분석 부트캠프 16기 3주차 - Python 자료형
·
데이터 분석 부트캠프/주간학습일지
숫자형 (number formatting)특징 : 따옴표(quotation) 필요없음int : 정수 (integer)1, -2, 3a = 9type(a)# int float : 실수 (floating point number)1.5, -2.3, 3.4a = 9.99type(a)# float 사칙 연산자(부호) (arithmetic operators)+ : 더하기- : 빼기* : 곱하기/ : 나누기** : 제곱// : 몫% : 나머지 x = 3y = 5print(x ** y) # x를 y번 곱한 것. c^d# 243print(x // y) # x를 y로 나눈 몫.# 0print(x % y) # x를 y로 나눈 나머지.# 3참고 - https://queirozf.com/entries/python-number..
[패스트캠퍼스] 데이터 분석 부트캠프 16기 2주차 - 기초수학/통계
·
데이터 분석 부트캠프/주간학습일지
통계학의 기본 이해확률 (probability) : 표본 공간에서 실험을 통해 어떤 사건으로 결과가 일어날 가능성표본 공간 (sample space) : 일어날 수 있는 모든 경우의 수의 집합사건 (incident) : 실험에 의해 벌어진 일이나 그 값 이산형(명목형) 자료 : 양의 정수로 셀 수 있는 자료연속형 자료 : 연속되는 수치 자료순서형 자료 : 순위나 순서의 개념을 갖는 자료 통계학 : 일부분으로 전체를 파악하려는 노력, 모집단으로부터 자료를 수집/정리/요약하고 표본 정보로부터 모집단에 대한 최적의 의사 결정을 내릴 수 있도록 정확한 정보를 제공하는 방법론을 연구하는 학문통계학의 강점 : 추론을 맞추면 일부분을 가지고 전체를 파악할 수 있음통계학의 맹점 : 추론이 절대로 정확할 수 없음 기술 ..
[패스트캠퍼스] 데이터 분석 부트캠프 16기 1주차 - EXCEL
·
데이터 분석 부트캠프/주간학습일지
빅데이터 이해하기 & 데이터 리터러시 함양하기Data-Driven : 데이터를 기반으로 의사결정을 하는 것어림잡아 마케팅 성과를 예측하는 대신 데이터를 기반으로 한 알고리즘으로 확률이 높은 경우의 수를 선택함컬리, 무신사, 카카오페이 등이 Data-Driven 경영 사례의 예시 Gartner의 Big Data 정의 : Big Data is high-volume, high-velocity and high-variety information assets demand cost-effective, innovative forms of information processing for enhanced insight and decision making. Big Data의 3V : High-Volume (대용량), Hi..