본문 바로가기
Data/[SeSAC 성동1기 전Z전능 데이터 분석가]

[성동1기 전Z전능 데이터 분석가] Day 26

by MIN_JOON 2023. 11. 21.
  • SQL 실무 프로젝트에 앞서 진행한 데이터 정합성 분석(기술 담당자 역할로 진행)
  • 프로젝트에 이용한 데이터셋
    • 공공자전거 이용내역
    • 공공자전거 고장 신고 내역
    • 공공자전거 대여내역
    • 공공자전거 대여소 정보
  • 데이터셋의 칼럼명 수정 및 COUNT 함수를 이용한 데이터 정합성 분석
    • 공공자전거 대여소 정보(총 COUNT: 2,749개)
      1. 테이블명: place_list
      2. 대여소번호: place_number
      3. 대여소명: place_name
      4. 소재지(자치구): address_district
      5. 소재지(상세주소): address_all
      6. 소재지(위도): address_lat
      7. 소재지(경도): address_long
      8. 설치시기: placed_at
      9. 설치형태(LCD 거치 개수): install_lcd
      10. 설치형태(QR 거치 개수): install_qr
      11. 운영방식: install_type
    • 공공자전거 고장 신고 내역(총 COUNT: 83,734개)
      1. 테이블명: trouble_list
      2. 자전거번호: bike_id
      3. 등록일시: created_at
      4. 구분: trouble_type
    • 서울시 공공자전거 이용내역(총 COUNT: 2,258,453개)
      1. 테이블명: usage_detail
      2. 대여일자: rent_date
      3. 대여소번호: place_number
      4. 대여소명: place_name
      5. 대여구분 코드: rent_code
      6. 성별: sex
      7. 연령대: age
      8. 이용건수: use_count
      9. 운동량: momentum  ('N' 값 4,907개)
      10. 탄소량: carbon ('N'값 4,907개)
      11. 이동거리(M): use_distance
      12. 이용시간(분): use_time_min
    • 자전거 대여내역(총 COUNT 2,500,000개)
      1. 테이블명: rent_detail
      2. 자전거번호: bike_id
      3. 대여일시: rent_date_detail
      4. 대여 대여소번호: place_number
      5. 대여 대여소명: place_name
      6. 대여거치대: rent_rests
      7. 반납일시: return_date
      8. 반납대여소 번호: return_place_num ('N'인 경우 9,888개)
      9. 반납대여소명: return_place_name ('N'인 경우 9,888개)
      10. 반납거치대: rent_rests('N'인 경우 9,888개)
      11. 이용시간(분): use_time_min
      12. 이용거리(M): use_distance
      13. 생년: birth('N'인 경우 192,518개 + 2040~2099년생 등 이상치 존재)
      14. 성별: sex('N'인 경우 689,200개 + 공란 75,883개)
      15. 이용자 종류: user_type
      16. 대여대여소ID: rent_place_id
      17. 반납대여소ID: return_place_id ('N'인 경우 9,888개)