- group_concat
- MySQL에서 열 병합을 위한 함수
- group_concat(컬럼명 separator 구분자)
- distinct를 통해 중복항을 제거하고 합칠 수 있음
#group_concat 예시(고객이 주문한 제품을 한 행으로 합치기)
select
customer_id,
group_concat(distinct product_name separator '/')
from
Product
group by
customer_id
customer_id | product_name |
1 | mango |
1 | milk |
2 | beer |
3 | chocolate |
customer_id | group_concat(distinct product_name separator '/') |
1 | mango/milk |
2 | beer |
3 | chocolate |
- 데이터 리터러시
- 데이터 수집과 원천을 이해하는 것
- 데이터에 대한 활용법과 핵심지표를 이해하는 것
- 데이터에 기반한 결론이라고 해서 맹목적으로 받아들이지 말 것
- 상관관계만으로 섣불리 의사결정하지 않을 것→인과관계 또한 함께 고려할 것
- 문제 정의
- 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술(목표와 분석 방향 설정)
- '왜?'에 집중할 것
- 문제 정의 방법론
- MECE(Mutually Exclusive, Collectively Exhaustive)
-상호 배타적이면서, 전체적으로 포괄적인 구성요소로 나누는 것
-중복되거나 누락된 정보가 존재해선 안됨 - 로직 트리(Logic Tree)
-MECE 원칙을 기반으로 문제를 작고 관리하기 쉬운 하위 문제로 분해
-정해진 답이 없으며, 사용자가 어떤 기준으로 나누냐에 따라 달라짐
-인과관계는 작은 가지 → 큰 가지 순서로
- MECE(Mutually Exclusive, Collectively Exhaustive)
- 지표 설정
- 지표: 특정 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준(전략적 결정에 필요한 핵심정보)
- 문제 정의 → '어떤 문제를 풀 것인가?'를 정의 / 지표 설정 →' 어떤 결과를 기대하는가?'에 대한 기준
- 주요 지표
- 활성유저(Active User)
-어디까지 경험한 유저를 활성유저로 선정할지 고려(일반유저와 나누는 기준)
-핸들링할 수 있는 유저의 사이즈 고려
-활성유저에 대한 정의에 따라 이탈유저가 정의되고 전략과 방향이 달라짐 - 재방문율(Retention Ratio)
-몇 %의 유저가 우리 서비스를 다시 이용하는가?(한 번 획득한 유저가 다시 서비스로 돌아왔는가?)
-기본적으로 방문을 기준으로 측정하지만 서비스 특성에 따라 기준을 다르게 할 수 있음
-N-day 리텐션: 최초 사용일로부터 N일 후 재방문한 활성유저의 비율(일반적으로 사용)
→서비스의 사용 주기가 길 경우, 과소평가될 가능성이 있음(매일 접속하는 서비스에 적합)
-Unbounded 리텐션: 특정 날짜를 포함하여 그 이후에 한 번이라도 재방문한 유저의 비율
→유저가 정기적으로 방문하는 서비스가 아닐 때, 사용 빈도가 높지 않은 서비스에 적합
→절대적인 수치보다는 지표가 어떻게 변화하는지에 대한 트렌드를 보는 용도로 활용
-Bracket 리텐션: 설정한 특정 기간을 기반으로 재방문율을 측정
→서비스 사용 주기가 길거나 주기적인 경우 사용 - 퍼널(Funnel)
-유저들이 어디서 이탈하는지를 확인하기 위한 구조화
-잠재고객을 유입시키며 최종적인 목표 액션을 달성할 때까지의 과정으로 각 단계가 지나며 이용자 수 감소
-각 단계의 전환율 측정
-AARRR인 유입, 활성화, 재방문, 수익, 추천을 단계화하여 서비스 보완지점을 찾음 - 고객 평생 가치(LTV,Life Time Value)
-해당 유저가 우리에게 평생 주는 이익에 대한 정량적 지표
-고객 생애 주기: 한 유저가 서비스를 사용하기 시작해서 이탈할 때가지의 기간
-LTV를 산출하는 방법은 여러가지이며, 서비스 및 관점마다 다르기 때문에 다각도로 고려해야함
-가정을 기반으로하는 지표이기 때문에 꾸준한 모니터링 필요
- 활성유저(Active User)
- 북극성 지표
- 제품/서비스의 핵심 지표로 유저에게 주는 핵심 가치를 가장 잘 나타낸 것
- 무엇에 집중하고 무엇을 포기해도 되는 지에 대한 방향성을 제시
- 서로 상반된 목표에 집중하거나, 중복으로 일하는 것을 방지(MECE 구조)
- 회사의 사업 목표를 나타내는 지표 중 선행지표일 것
- 예시: 넷플릭스-월간 시청시간 중앙값, 에어비엔비-예약 완료 수
- 결과 및 결론 도출
- 결과: 분석이나 처리 등 이후에 얻어진 구체적인 데이터 출력(숫자, 통계, 그래프, 차트 등)
- 결론: 분석된 데이터 결과를 기반으로 이끌어낸 의미나 통찰
- 결과-결론 도출 시 스토리텔링이 필요하지만 필요 이상으로 자신의 해석을 융합해선 안됨
→데이터를 통해서 알 수 있는 정도만
이번 주도 절반이 지나갔다:)
슬슬 적응이 되고 있는 느낌
알고리즘 코드카타도 슬슬 더 신경써야겠다
'Data > [스파르타 내일배움캠프]' 카테고리의 다른 글
[TIL]본캠프 10일차 (2) | 2024.04.26 |
---|---|
[TIL]본캠프 9일차 (1) | 2024.04.25 |
[TIL]본캠프 7일차 (2) | 2024.04.23 |
[TIL]본캠프 6일차 (2) | 2024.04.22 |
[WIL]본캠프 1주차 (3) | 2024.04.19 |