프로젝트 개요
목표: 모교인 서울과학기술대가 위치한 공릉동의 상권을 분석하여 해당 상권의 소비자군의 특성, 소비패턴을 도출하여 적절한 시사점과 전략을 제안한다.
데이터: 공공데이터 포털의 서울시 상권 데이터에서 공릉동 지역을 발췌했습니다. (실제 데이터)
-
데이터의 상권 코드를 도메인에 맞게 새로운 카테고리로 분류하였습니다.
ex) (한식, 일식, 중식) -> 음식점 / (철물점, 잡화점, 시계, 안경, 고시원 등) -> 생활
__
머신러닝 프로젝트를 위해 데이터를 탐색하던 중 해당 데이터를 통해 상권분석에 대한 아이디어를 얻었습니다.
저는 효과적인 상권분석을 위해 이 데이터와 적합한 분석흐름을 고민하던 중 "STP 전략"의 흐름을 적용하기로 결정하였습니다.
*STP 전략 (Segmentation, Targeting, Positioning)
STP 전략은 마케팅에서 전략적 활동을 결정하는 주요 전략으로 쓰입니다.
특히 이는 비즈니스 도메인에서 시장을 세분화하고, 타겟을 설정하여, 그 타겟에 맞는 전략을 제시하는 기본적인 분석 방향으로 제안되곤 합니다.
__
가장 먼저
-
S, segementation을 통해 소비자군을 나누어 각 segment에 속한 소비자들의 특성과 소비패턴을 도출합니다.
-
이후, 앞서 도출한 segment별 특성을 바탕으로 T, target을 도출하여 전략적인 방향을 설정합니다.
-
마지막으로 P, Positioning은 자사의 제품이나 서비스가 소비자들의 인지 속에 어떻게 자리잡을 지, 그것을 고안하여 구체적인 전략을 제시하는 단계입니다.
*그런데 이 분석의 목표는 어떠한 특정 제품, 서비스에 대한 것이 아니므로 타겟을 더 많은 로 이끄는 전략들을 모두 positioning이라고 보았습니다.
__
위와 같은 흐름을 고려하여 다음과 같은 분석기법을 선택, 적용하였습니다.
- S: Segmentation, 군집분석
- T: Targeting, 회귀분석
- P: Positioning, 마케팅 전략 제시
여기서 2. Targeting에서 회귀분석의 종속변수로 "분기별_매출_건수"를 선택하였습니다.
왜냐하면, 각 서비스 업종의 분야와 그에 따른 가격이 상이할 뿐만 아니라 매출 건수와 매출 금액 간의 매우 강한 양의 상관관계가 관찰되었기 때문입니다.
*즉, 매출 건수가 높을 수록 매출 금액이 올라가며, 소비자들이 많이 이용하도록 하는 것(매출 건수를 높이는 것이)이 상권의 활성화에 있어서 더 유효한 시사점이라고 보았습니다.
서비스 업종 분포
성별에 따른 매출 비율, 연령에 따른 매출 비율
- Segmentation
K-means 클러스터링 알고리즘 이용
k 수는 SSE를 가장 크게 감소시키는 지점으로 선택 (엘보우 기법) (K=4)
- Targeting
앞선 군집분석 결과 상권의 세부 특성을 뽑아낼 수 있었습니다.
그 결과 수가 가장 많은 1번 군집, 수는 적지만 매출이 압도적으로 높은 군집 3을 타겟군으로 설정하였습니다.
이후 군집별 데이터 셋을 분리하여 서비스 업종과 매출 건수의 관계를 도출하기 위해 회귀분석을 진행하였습니다.
*reference: 서비스 업종_농수산물
군집 1번(수가 가장 많은)에서는 마트/편의점이 매출 건수에 가장 큰 영향력을 가지고 있다.
군집 3번(매출 금액이 가장 많은)에서는 음식점이 매출 건수에 가장 큰 영향력을 가지고 있다.
*회귀계수 유효성(t-test) 등은 코드 속 회귀분석 레포트 참조
- Positioning (예시)
가장 많은 지점이 속한 군집 1은 여성의 비율이 높으며 마트/편의점이 매출 건수에 가장 큰 영향력을 가진다.
이에 여성 고객을 대상으로 한 쿠폰 발행 등이 포지셔닝 전략이 될 수 있다.
또한 가장 매출 금액이 큰 군집 3에서는 음식점이 매출 건수에 가장 큰 영향력을 미친다.
이는 음식점이 매출 금액에도 큰 영향을 미치고 있다는 것을 시사한다. (매출건수와 매출금액은 양의 상관관계)
따라서 음식점의 매출 건수를 유지/ 홍보에 노력하며, 10대의 매출비율이 가장 작으니 10대들의 수요를 분석하여 그들에 맞는 포지셔닝 전략이 필요하다.