본문 바로가기
Data/[SeSAC 성동1기 전Z전능 데이터 분석가]

[성동1기 전Z전능 데이터 분석가] Day 18

by MIN_JOON 2023. 11. 8.
  • 뉴스레터 서비스의 데이터를 이용하여 분석을 진행하였다.
  • 데이터 내의 항목으로는 유저의 ID, 생성일, 생성시간, 레퍼럴(추천) 갯수, 받은 뉴스레터 수, 오픈한 뉴스레터 수, 클릭한 뉴스레터 수, 유입경로(organic, embed), 취소한 시간, 마케팅 동의 여부가 있었다.
  • 이 중 받은 뉴스레터 수와 오픈한 뉴스레터 수를 이용하여 오픈율을 계산하고 이것 또한 분석에 이용하였다.
  • 다른 분들이 좋은 분석들을 많이 하셨는데 나는 구독자 수와 평균 오픈율의 변화에 주목해서 분석을 진행하였다.

  • 7월부터 서비스가 시작되었기 때문에 초기 구독자 수가 많은 것을 고려하고 보면 9월에 큰 폭으로 구독자 수가 증가한 것을 볼 수 있다. 하지만 구독자들의 뉴스레터 오픈율은 오히려 50% 아래로 낮아지는 것을 볼 수 있는데 광고나 어떤 행동으로 인해 구독자 수는 증가하였지만 구독자들의 활동이 지속적으로 이어지지 않은 것으로 보인다. 따라서 뉴스레터를 오픈할 때 추첨을 통해 경품을 지급하는 이벤트 등과 같은 오픈으로 이어지는 대책이 필요해 보인다.

  • SQL(Structure Query Language)
    • 저장된 데이터 중에 내가 보고 싶은 데이터를 가져올 때 사용할 수 있다.
    • 단순하게 가져오는 것 뿐만 아니라 새로운 데이터를 저장, 기존 데이터를 수정 및 삭제하는 것도 가능하다.

      비개발자: 분석에 필요한 데이터를 가져 오는 것이 목적
      개발자: 사용자에게 보여줄 데이터를 가져오고 생성되는 데이터를 저장·업데이트 ·삭제하는 것이 목적

  • Query 함수
    • 구글 스프레드 시트의 데이터에서 내가 원하는 값만 뽑고 나누고 평균 ·합산 등의 계산을 하는 함수
    • SQL과 유사하고 별다른 설치 없이 바로 사용할 수 있어 SQL에 익숙해지는 연습을 할 수 있다.
    • 띄어쓰기나 쉼표, 따옴표 등을 모두 동일하게 입력해주어야 인식된다.
    • =QUERY(데이터의 범위, "SELECT 가져오려는 데이터의 열, [limit 이나 where 등과 같은 조건]")

      1. 데이터의 열 정보에서 *는 전부 가져오게 하는 명령어
      2. limit은 결과 데이터를 제한할 수 있음
      3. where를 통해 가져오는 데이터에 조건을 설정할 수 있음(판매데이터라면 promotion이나 none과 같은 조건)