본문 바로가기
Data/[SeSAC 성동1기 전Z전능 데이터 분석가]

[성동1기 전Z전능 데이터 분석가] Day 42

by MIN_JOON 2023. 12. 12.
  • 데이터 시각화를 진행할 때 어떤 차트를 써야할까
  • 변화를 보여주는 차트
    • 라인 차트(Line Chart): 연속형 데이터의 트렌드 표현에 주로 이용/전반적인 트렌드의 증감 변화를 확인
      →축이 0에서 시작할 필요는 없으며 라인이 많아진다면 차트는 혼란을 유발할 수 있음
    • 칼럼 차트(Column Chart): 시간에 따른 변동을 보여주거나 서로 다른 카테고리의 값을 비교
      →축은 0부터 시작해야하며 시간에 따른 변화를 보여줄 때는 바가 아닌 칼럼을 사용
    • 영역 차트(Area Chart): 시간의 흐름에 따른 변화를 보여주며 라인 차트와 다르게 volume을 표현할 수 있다
  • 비율을 보여주는 차트
    • 비율 바 차트(% Bar Chart): 전체에서의 구성 비율을 간단하게 표현
    • 도넛 차트(Donut Chart): 구성 비중을 비교하고 가운데 빈 공간을 활용할 수 있다
      →파이 차트와 달리 길이 속성을 활용하여 비교가 가능하다
  • 비교를 보여주는 차트
    • 바 차트(Bar Chart): 서로 다른 카테고리의 값 비교에 주로 활용
      →축은 0부터 시작해야하며 데이터 레이블이 길 경우 효과적이다
    • 그룹 차트(Group Chart): 서로 다른 카테고리의 값을 여러개 비교할 때 주로 사용
    • 히트맵(Heat Map): 데이터 값을 컬러로 변환시켜 많은 데이터의 패턴을 한번에 볼 때 주로 사용(색상 팔레트 범례 필요)
  • 상관관계를 보여주는 차트
    • 산점도(Scattor Plot): 두 변수의 관계를 보여주기 위해서 주로 사용
      →데이터 포인트가 과다할 경우 Overfloating 문제가 발생함/x축에 선행지표, Y축에 후행지표
  • 차트 활용 시 주의점
    • 3D차트는 값을 왜곡할 가능성이 존재
    • 파이차트는 각도를 통해 정확한 비교가 불가능하기에 도넛 차트가 더 좋음
    • 막대 그래프의 목적이 값 비교일 경우 축은 0부터 시작
    • 라인 그래프의 목적이 경향 파악일 경우 0부터 시작할 필요가 없다
    • 시간 축은 X축을 기본으로
  • 어떻게 차트를 써야할까
    • 중요한 정보만 강조할 것(데이터의 노이즈를 최소화, 데이터 잉크 비율 최대화)
    • 자세히 보지 않아도 의미를 알 수 있는 텍스트와 함께 제공
    • 다양한 관점의 시각화: Macro/Medium/Micro Level
    • 차이를 강조할 것(서로 다른 지표인 경우 색상 또한 다르게 설정)
    • 게슈탈트 원칙 고려: 근접성/공통성/연속성/유사성(근접 혹은 연속하거나 유사성 혹은 공통성이 존재하는 경우 한 묶음으로 인식)