728x90 데이터분석가155 [성동1기 전Z전능 데이터 분석가] Day 27 SQL 실무 프로젝트의 데이터 중복 측정 및 데이터 전처리 진행+탐색적 데이터 분석(EDA) 중복 데이터: 반납대여소 이름은 1개인데 반납대여소 번호는 2개인 경우 rent_detail 국회 3문 (297, 4580) 천왕이펜하우스5단지 앞 (1981, 2817) 한양수자인아파트 앞 (1828, 4811) place_list 한양수자인아파트 앞(4811 , 1828) 데이터 전처리 진행 place_name 문자열 앞에 공백이 있는 행이 존재 →UPDATE place_list SET place_name = TRIM(BOTH '' FROM place_name); 중복 데이터는 각각의 넘버에 따라 대여소 이름을 수정 →ex)국회3문의 데이터를 각각의 넘버 297과 4580에 따라 국회3문1, 국회3문2로 수정.. 2023. 11. 21. [성동1기 전Z전능 데이터 분석가] Day 26 SQL 실무 프로젝트에 앞서 진행한 데이터 정합성 분석(기술 담당자 역할로 진행) 프로젝트에 이용한 데이터셋 공공자전거 이용내역 공공자전거 고장 신고 내역 공공자전거 대여내역 공공자전거 대여소 정보 데이터셋의 칼럼명 수정 및 COUNT 함수를 이용한 데이터 정합성 분석 공공자전거 대여소 정보(총 COUNT: 2,749개) 테이블명: place_list 대여소번호: place_number 대여소명: place_name 소재지(자치구): address_district 소재지(상세주소): address_all 소재지(위도): address_lat 소재지(경도): address_long 설치시기: placed_at 설치형태(LCD 거치 개수): install_lcd 설치형태(QR 거치 개수): install_q.. 2023. 11. 21. [성동1기 전Z전능 데이터 분석가] Day 25 COALESCE: 안의 인자들 중 첫 번째로 온 Non-Null값을 반환하는 함수 syntax: select column1, COALESCE(column1,0) from TABLE RANK OVER: 데이터들의 순위를 출력하기 위해 사용하는 함수 syntax: RANK() OVER (Order by column2 desc) ranking(순위열의 별칭을 설정) EX) SELECT Studentname, Subject, Marks, (DENSE_)RANK() OVER(ORDER BY Marks desc) RANK FROM ExamResult ORDER BY RANK; PARTITION BY: RANK OVER를 사용할 때 GROUP BY 처럼 사용할 수 있다. EX) SELECT Studentname, S.. 2023. 11. 18. [성동1기 전Z전능 데이터 분석가] Day 24 SQL 실습 # 1.공판장품목별입출고현황 데이터 중 상태가공분류가 냉동이고 기준일자가 "2023.9.1."이며 입,출고량이 0인 데이터는 제외하고 데이터를 조회하세요. select * from 공판장품목별입출고현황 where 1=1 and product_category_name="(냉동)" and stock_date = "2023.9.1" and stock_quantity !=0 and shipment_quantity !=0; # 2.공판장품목별재고현황 테이블에서 냉동이거나 냉장인 수산물품목의 전체입고량 무게가 2번째로 높은 물류센터는 어디인지 확인하세요. SELECT warehouse_code, warehouse_name, SUM(inventory_quantity_kg) as sum_inventory_.. 2023. 11. 16. 이전 1 ··· 32 33 34 35 36 37 38 39 다음 728x90