데이터 분석 기법 비교
분석 기법 | 주요 목적 | 주요 지표/측정 방식 | 장점 | 단점 |
코호트 분석 | 특정 시점에 특정 행동을 한 그룹(코호트)의 행동 변화를 추적 | 고객 생애주기, 리텐션율, 매출 기여도 등 | 그룹별 행동 변화 파악 용이, 시계열 분석에 유리 | 세분화가 잘못되면 잘못된 결론 유도 가능, 초기 데이터가 중요 |
잔존율 분석 | 고객이 특정 시점 이후에도 서비스를 계속 이용하는 비율 분석 | 리텐션율, 생존율, 평균 잔존 기간 | 고객 유지 요인 파악, 재방문 유도 전략 수립에 효과적 | 장기적인 고객 행동 분석에 적합, 초기 지표 분석엔 다소 제한적 |
RFM 분석 | 고객 가치를 평가하여 마케팅 전략을 세분화 | 최근 구매일(Recency), 구매 빈도(Frequency), 구매 금액(Monetary) | 간단한 점수화로 고객 분류, 고객 이탈 방지 전략에 유리 | 시간에 따른 변화 반영 어려움, 최신 고객 정보 반영에 한계 |
분석 기법 설명
- 코호트 분석 (Cohort Analysis)특정 시점에 동일한 행동을 수행한 고객 집단을 기준으로 행동 변화를 추적하는 분석 기법. 예를 들어, 특정 월에 가입한 신규 고객 집단의 이후 리텐션율을 분석하여 특정 시점 이후 유지율 변화를 파악할 수 있음.
- 주요 활용 사례: 사용자 온보딩 성과 측정, 특정 캠페인 영향 평가
- 장점: 그룹별 행동 변화를 파악하기 쉬워 리텐션 개선에 활용 가능
- 단점: 집단의 초기 특성(구성원 수 등)이 분석 결과에 영향을 미칠 수 있어 초기 데이터가 중요
- 잔존율 분석 (Retention Analysis)고객이 특정 시점 이후에도 서비스를 계속 이용하는 비율을 측정하여 고객의 생애주기와 유지 요인을 파악하는 기법. 보통 고객 이탈과 유지 비율을 시계열로 파악하여, 고객 충성도를 높이기 위한 전략 수립에 유용함.
- 주요 활용 사례: 구독 기반 서비스의 고객 유지율 평가, 장기 고객 이탈 방지 전략 수립
- 장점: 고객이 지속적으로 서비스를 이용하는 이유를 분석하여 이탈 방지에 유리
- 단점: 장기적인 분석에 적합하며, 단기 고객 분석이나 신규 고객 관련 초기 분석에는 다소 제한적
- RFM 분석 (Recency, Frequency, Monetary Analysis)고객의 최근 구매 일자(Recency), 구매 빈도(Frequency), 구매 금액(Monetary)를 기반으로 고객 가치를 평가하고 세분화하는 기법. 이 분석을 통해 고가치 고객을 식별하고, 타겟 마케팅을 통해 고객 이탈을 방지할 수 있음.
- 주요 활용 사례: VIP 고객군 대상 마케팅, 고객 충성도 평가, 특정 그룹 재활성화 캠페인
- 장점: 고객을 손쉽게 점수화하여 등급을 나누고, 전략을 차별화하는 데 유리
- 단점: 고정된 RFM 점수 체계로는 고객 가치의 시간에 따른 변화가 반영되지 않아 최신 고객 행동 반영이 어려움
데이터베이스 범주
1. 관계형 데이터베이스 (Relational Database Management System, RDBMS)
- MySQL, PostgreSQL, Microsoft SQL Server
- 테이블 형태로 데이터를 저장하며, 행과 열로 구성된 구조적인 데이터 관리에 적합합니다.
- 데이터 간의 관계를 정의하고 관리하는 데 강점이 있으며, 복잡한 쿼리를 수행할 수 있습니다.
- 기업용 시스템, 웹 애플리케이션 등 다양한 분야에서 널리 사용됩니다.
2. NoSQL 데이터베이스 (Not Only SQL)
- MongoDB
- 문서 형태로 데이터를 저장하며, 유연한 데이터 모델을 지원합니다.
- 대규모 데이터 처리, 실시간 분석, 고가용성이 요구되는 환경에 적합합니다.
- 웹 애플리케이션, IoT, 모바일 앱 등에서 많이 사용됩니다.
- Redis
- 키-값 형태로 데이터를 저장하며, 매우 빠른 속도로 데이터를 읽고 쓸 수 있습니다.
- 캐싱, 세션 관리, 메시지 큐 등 다양한 용도로 사용됩니다.
3. 문서형 데이터베이스
- Elasticsearch
- JSON 문서를 저장하고 검색하는 데 특화된 데이터베이스로, 텍스트 검색, 로그 분석 등에 활용됩니다.
- 빅데이터 분석, 검색 엔진 구축 등에 적합합니다.
4. 임베디드 데이터베이스
- SQLite
- 매우 가볍고 단순한 데이터베이스로, 모바일 앱, 임베디드 시스템 등 자원이 제한적인 환경에서 사용됩니다.
- 작은 규모의 데이터를 저장하고 관리하는 데 적합합니다.
데이터베이스 선택 기준
- 유연한 데이터 저장: MongoDB
- 빠른 데이터 접근: Redis
- 검색 엔진, 빅데이터 분석, 로그 분석, 텍스트 검색: Elasticsearch
- 다면적인 도구: Elasticsearch
- 자원이 제한된 환경, 소규모 데이터 관리: SQLite
- 빠르고 신뢰할 수 있는 관계형 데이터베이스: PostgreSQL, MySQL
생성형 AI 비교 : GPT O1, Claude 3.5 Sonnet, Perplexity Pro, Gemini Advanced (1.5 Pro)
성능 및 기능
기능 | GPT O1 | Claude 3.5 Sonnet | Perplexity Pro | Gemini Advanced |
추론 능력 | 매우 우수 | 우수 | 우수 | 우수 |
컨텍스트 윈도우 | 128K 토큰 | 10만 토큰 | 불명확 | 100만 토큰 |
코딩 성능 | 매우 우수 | 우수 | 양호 | 우수 |
다국어 지원 | 지원 | 개선됨 | 35개 이상 | 지원 |
이미지 처리 | 개발 중 | 지원 | 지원 | 지원 |
장점 | - 뛰어난 텍스트 생성 능력 - 다양한 작업 수행 가능 (번역, 요약, 질의응답 등) - 광범위한 지식 베이스 |
- 긴 텍스트 처리 능력 - 높은 정확도 - 안전성 및 윤리적 고려 강조 |
- 실시간 정보 검색 및 통합 - 출처 명확히 제시 - 무료 사용 가능 |
- 100만 토큰의 넓은 컨텍스트 창 - 최신 정보 접근 가능 - 논리적 추론, 코딩, 창의적 협업에 강점 |
단점 | - 제한적인 컨텍스트 창 - 최신 정보 부족 |
- 한국어 지원 부족 | - 텍스트 생성 능력이 ChatGPT에 비해 떨어짐 | - 정보 부족 시 대안 제시에 국한 |
특징 | - 다양한 플랫폼과의 연동 | - API 접근성 | - 웹 검색 기반 정보 제공 | - Google 검색 스니펫 활용 |
주요 특징
- GPT O1: STEM 추론 우수, 수학 문제 해결 능력 높음, 고급 보안 기능
- Claude 3.5 Sonnet: 대학원 수준 추론, 자연스러운 대화, 고품질 콘텐츠 생성
- Perplexity Pro: 실시간 검색, 파일 분석, 기업용 보안
- Gemini Advanced: 대규모 컨텍스트, 음성 대화, Google 앱 연동
사용 사례
- GPT O1: STEM 문제, 고급 코딩, 과학 연구
- Claude 3.5 Sonnet: 작업 자동화, R&D, 전략 분석
- Perplexity Pro: 기업 정보 검색, 문서 요약, 팀 협업
- Gemini Advanced: 대규모 문서 분석, AI 어시스턴트, 일정 관리
가격
- GPT O1: 월 $20 [API — o1-preview (입력 $15, 출력 $60/백만 토큰), o1-mini (입력 $3, 출력 $12/백만 토큰)]
- Claude 3.5 Sonnet: 월 $20
- Perplexity Pro: 월 $20
- Gemini Advanced: 월 $20
AI 도입 생산성 어플리케이션 비교
어플리케이션 | 주요 기능 및 특징 | 장점 | 단점 |
Napkin AI | 메모와 아이디어를 자동 분류 및 시각화, 연관성 분석을 통해 아이디어 연결 | 직관적인 아이디어 관리, 자동화된 연관성 분석 | 고가 요금제, 한국어 지원 미비 |
Mermaid Chart | 텍스트 기반의 다이어그램과 차트 생성 (예: 플로우차트, 시퀀스 다이어그램 등) | 코드만으로 다양한 시각화 가능, 빠른 전환 | 복잡한 차트 생성에 한계, 대화형 기능 미흡 |
Excalidraw | 손그림 스타일의 그림과 다이어그램 도구, 간단한 협업 및 시각화에 적합 | 자유로운 표현과 창의적 다이어그램 생성, 사용자 친화적 인터페이스 | 전문적인 그래픽에는 제한적, 복잡한 작업에 비효율적 |
Gamma | AI 기반 프레젠테이션 및 문서 생성, 자동화된 슬라이드 디자인 및 추천 기능 | 빠른 프로토타입 생성, 자동화된 시각적 제안 | 제한된 커스터마이징, 콘텐츠 완성도에 따라 추가 편집 필요 |
LangChain | AI 언어 모델과의 연동을 통해 복잡한 언어 및 데이터 처리, ChatGPT와의 통합 가능 | 데이터 분석 및 자동화된 문서 처리, 다목적 사용 가능 | 고급 설정에 대한 지식 필요, 초기 설정 복잡 |
어플리케이션 세부 설명
- Napkin AI
- 개인 아이디어 및 메모를 자동으로 정리하고, 연관성 있는 정보들을 연결하여 추천
- 창의적인 사고 지원에 탁월하나 고가이며 한국어 지원이 미비
- Mermaid Chart
- 텍스트 코드 입력을 통해 다이어그램 생성
- 플로우 차트와 같은 간단한 다이어그램 시각화에 유용하며, 코드만으로 빠르게 시각화 가능
- Excalidraw
- 디지털 손그림 툴로 직관적이며, 협업에 유용
- 제한적이나 창의적인 도식화에 강점. 하지만 복잡한 작업 시 비효율적일 수 있음
- Gamma
- AI로 프레젠테이션 생성 및 디자인을 지원
- 빠르게 프로토타입을 제작할 수 있으나, 맞춤화에 제한이 있어 세부 편집이 필요할 수 있음.
- LangChain
- ChatGPT와 같은 AI 언어 모델을 기반으로 데이터 분석과 문서 처리 자동화 가능
- 유연하지만 설정에 익숙하지 않으면 초기 설정이 다소 복잡함
'데이터 분석 부트캠프 > 주간학습일지' 카테고리의 다른 글
[패스트캠퍼스] 데이터 분석 부트캠프 16기 13주차 - Tableau (2) | 2024.11.15 |
---|---|
[패스트캠퍼스] 데이터 분석 부트캠프 16기 9주차 - SQL 문법 (2) | 2024.10.18 |
[패스트캠퍼스] 데이터 분석 부트캠프 16기 8주차 - SQL 기본 이론 (3) | 2024.10.11 |
[패스트캠퍼스] 데이터 분석 부트캠프 16기 5주차 - Python을 활용한 데이터 시각화 (NumPy / Pandas / MatPlotLib / Seaborn) (3) | 2024.09.20 |
[패스트캠퍼스] 데이터 분석 부트캠프 16기 4주차 - Python의 Selenium을 활용한 데이터 크롤링 (6) | 2024.09.13 |