안녕하세요. 오늘은 제가 최근에 참여했던 SQL 프로젝트에 대한 회고록을 작성해보려고 합니다. 이 프로젝트는 2024년 10월 24일부터 11월 4일까지 약 2주간 진행되었어요.
프로젝트 개요
저희 팀은 Kaggle에서 제공하는 Brazilian E-commerce Dataset과 Marketing Funnel Dataset을 활용했습니다. 이 데이터셋은 브라질의 이커머스 회사의 2년간 거래 데이터와 마케팅 데이터를 포함하고 있어요.
팀 구성과 진행 과정
저희 팀은 4명으로 구성되었는데, 다행히도 한 분께서 탄탄한 브랜드 마케터 경력을 가지고 계셨어요. 그래서 초반에는 B2B 마케팅, MQL, 리드, 전환 등의 개념을 쉽게 정리할 수 있었습니다.
프로젝트는 총 3차 발표로 진행되었어요. 10월 24일에 첫 회의를 시작으로, 10월 25일에 1차 멘토링, 10월 30일에 1차 발표, 그리고 11월 4일에 최종 발표를 했습니다.
분석 주제 선정
SQL로 여러 데이터를 조인하고 도식화를 해보며 데이터를 살펴보다가 재미있는 점을 발견했어요. 매출의 80%를 이루는 판매자가 상위 20%에 쏠려있는 것을 알게 되었습니다.
이는 파레토의 법칙이라고 하는데, 이를 보완하기 위해 중소 규모의 셀러에게 판매하기 적합한 카테고리를 추천하고, 상위 셀러들의 특징을 벤치마킹하고 그들이 주로 다룬 카테고리와 연관 카테고리를 추천해주는 프로젝트를 추진하기로 했습니다.
분석 과정
어떤 논리로 분석하게 되었는지에 대한 배경과 분석 목적을 설정하기 위해 올리스트의 분기별 매출 흐름을 파악해보니 올리스트의 매출이 2018년도에 진입하면서 하락하고 있다는 점을 알게 되었습니다. 따라서 올리스트가 성장하기 위해서는 상위 셀러 뿐 아니라 중소 규모의 셀러도 성장시켜야 한다고 판단하였고, 이들을 성장시키기 위해 할 수 있는 두가지를 데이터를 기반으로 다뤄보았습니다.
먼저 추천할만 한 카테고리, 즉 블루오션에 대해 파악해보기로 했어요. 블루오션은 크게 수요와 공급의 비율, 성장률, 그리고 셀러의 집중도를 기준으로 스코어링을 해서 적합한 카테고리를 추려냈습니다. 이 과정에서 매출 규모가 크고 소수의 셀러들이 큰 매출 비중을 차지하는 과점 시장을 제거했습니다.
그리고 상위 20%의 셀러를 '빅셀러'로 규정하고 이들의 특징을 분석해봤습니다. 또한 빅셀러들은 하위 셀러 대비 고가의 제품을 취급하고, 주로 최소 두개 이상의 카테고리를 다루는 멀티 셀러라는 점을 발견했습니다.
그래서 회귀분석 방법 중 상호 정보량을 활용하여 두 연속형 변수 간의 비선형 관계를 분석하는 상호 회귀 분석 기법을 통해 이들이 다루는 카테고리와 가장 연관성이 높은 카테고리를 추려내는 과정을 진행했어요.
이를 통해 중소 규모의 셀러들은 블루오션 카테고리의 제품을 취급하고 그와 관련성이 높은 카테고리를 함께 다루는 방식을 추천해주기로 결론을 냈습니다.
배운 점
이번 프로젝트에서 배운 내용을 다섯가지로 추려볼께요.
첫째, 데이터 분석 전에 배경지식을 쌓는 게 얼마나 중요한지 깨달았어요. 마케팅 용어와 데이터 분석 방식의 개념을 이해하는 데 시간을 투자한 덕분에 후반부 분석이 훨씬 수월해졌습니다.
둘째, 팀워크의 중요성을 느꼈습니다. 서로 다른 배경을 가진 팀원들과 협업하면서 더 깊이 있는 분석을 할 수 있었어요.
셋째, 데이터 탐색의 중요성을 배웠습니다. 초기에 데이터를 꼼꼼히 살펴본 덕분에 핵심 문제점을 발견할 수 있었거든요.
넷째, MySQL과 파이썬을 같이 활용하면서 SQL 실력이 많이 늘었어요. 실제 이커머스 데이터의 구조를 파악하고 다루는 경험이 정말 값졌습니다.
마지막으로, 단순한 데이터 분석을 넘어 비즈니스 관점에서의 인사이트를 도출하는 법을 배웠어요. 이 경험은 앞으로 실무에서 정말 유용하게 쓰일 것 같아요.
소감
이번 프로젝트는 데이터 분석과 비즈니스 전략 설계의 유기적인 연결성을 경험할 수 있는 소중한 기회였습니다. 특히 데이터에서 단순한 통계적 사실을 발견하는 것에 그치지 않고, 이를 기반으로 실질적인 솔루션을 제안하는 과정에서 분석가로서 한 단계 성장했음을 느꼈습니다.
또한, 다양한 전문성을 가진 팀원들과 함께 협업하며 시야를 넓히고, 마케팅과 데이터 분석이 결합된 프로젝트의 재미를 느꼈습니다. 때로는 예상치 못한 데이터의 복잡성과 문제에 부딪히기도 했지만, SQL과 Python을 활용해 이를 해결하면서 도구 사용 능력도 한층 강화되었습니다.
무엇보다 이번 프로젝트는 데이터를 활용해 비즈니스의 문제를 해결하고, 이를 통해 실제 성과를 낼 수 있는 전략을 제시하는 과정이 얼마나 매력적인지 다시금 깨닫게 해주었습니다. 이 프로젝트를 함께해준 팀원들과 거침없는 피드백을 주신 강사님께 감사드리며, 앞으로 SQL을 활용해 더 다양한 데이터셋을 분석해 볼 예정입니다.
여러분도 만약 데이터 분석 부트캠프에 참여해 SQL 프로젝트에 할 차례가 되셨을 때 제가 인사이트를 도출한 방식이 참고가 된다면 좋겠습니다. 저희 팀이 찾아낸 인사이트보다 더 참신하고 다양한 개선 방안을 찾으실 수도 있을 거예요.
'데이터 분석 부트캠프 > 회고록' 카테고리의 다른 글
[데이터 분석 부트캠프] 5개월간의 부트캠프 수강생의 하루 (1) | 2025.02.19 |
---|---|
[데이터 분석 부트캠프] 패스트캠퍼스 데이터 분석 부트캠프 과정 종료 회고 (0) | 2025.02.11 |
[데이터 분석 부트캠프] 태블로 프로젝트 후기 - 부동산 대시보드 만들기 (0) | 2025.01.12 |
[데이터 분석 부트캠프] 이커머스 데이터 활용한 파이썬 프로젝트 후기 (0) | 2024.11.07 |
[데이터 분석 부트캠프] 인생에 단 한 번뿐인 부트캠프 지원 과정 되돌아보기 (20) | 2024.10.18 |