본문 바로가기
Data/[SeSAC 성동1기 전Z전능 데이터 분석가]

[성동1기 전Z전능 데이터 분석가] Day 13

by MIN_JOON 2023. 11. 1.
  • 데이터 확보 및 처리
    • 데이터 그 자체로는 아무것도 할 수 없다
    • 데이터를 모아야(데이터 베이스) 분석이 가능하다. 즉, 잘 모아야 한다.
    • 데이터 확보 과정에서부터 데이터 처리가 용이하도록 신경써야한다.
      (입력할 때부터 정해진 형태로 입력하도록 제한하는 등→입력할 때부터 서식에 신경쓸 것)
  • 데이터베이스를 만들 때
    • 가급적 하나의 시트에 만들 것
    • 첫 행(Row)는 반드시 '필드(항목)명'으로 설정할 것
    • 데이터(레코드)는 위에서부터 아래로 쌓이도록 설정할 것
    • 빈 행(Row)이나 빈 열(Column)없이 만들 것
    • 셀 병합 없이 만들 것
  • 데이터 클린징
    • 일반적으로 데이터를 바로 분석에 사용할 수 없다.
    • 제대로 된 분석을 위해 처리가 필요하다.(데이터를 분석하기 편하게 변환하는 과정)

  • 페이스북과 GA의 데이터를 이용해 데이터 클린징과 가설 수립 및 데이터 분석을 실습으로 진행하였다. 도메인 지식이 중요하다는 말이 와닿지 않았는데 오늘 그것이 왜 중요한지 직접 깨닫게 되었다. 페이스북의 데이터 중 좋아요, 댓글수, 공유 등의 데이터는 이해할 수 있었지만 도달, 노출 등의 용어에 대한 이해가 없이 데이터 분석을 진행하려 하자 많은 것이 엇나가기 시작했다. 결국 어떻게 데이터 분석을 진행하고 어떤 방향으로 진행해야 하는가에 대한 확신 없이 진행되었고 생각만큼 좋은 분석이 이루어지지 않았다고 생각한다. 지금은 배워가는 중이기 때문에 충분히 겪을 수 있는 시행착오라고 생각하며 추후에 좋은 데이터 분석가가 되기 위한 발판으로 삼아야겠다.

페이스북을 이용한 실습