본문 바로가기
728x90

Data/[스파르타 내일배움캠프]112

[TIL]본캠프 81일차 생키 차트(Sankey Chart)데이터의 흐름을 나타내는 데이터 시각화 유형의 하나데이터의 이동이나 흐름을 시각적으로 강조하여 어떤 항목의 기여도가 높은지 파악하는데 효과적노드(Node): 하나의 데이터 항목을 의미링크(Link): 노드와 노드를 연결하는 데이터의 이동 경로복잡한 프로세스를 단순화하여 보여주는데 효과적(에너지 흐름을 파악하는 에너지 분야, 자금 흐름 파악을 위한 경제 분야)노드 간격과 링크의 두께가 겹치지 않도록 주의해야 함링크의 두께로 어떤 데이터의 크기가 큰지 알 수 있음 2024. 8. 9.
[TIL]본캠프 80일차 SWOT 분석비즈니스나 특정 프로젝트의 강점, 단점, 기회, 위협을 식별하기 위해 사용S: Strengths(강점) - 조직이 잘하는 것, 특별한 점, 잠재고객이 좋아하는 점W: Weaknesses(약점) - 개선해야할 점O: Opportunities(기회) - 조직의 목표, 사용할 수 있는 리소스T:  Threats(위협) - 업계의 변화, 새로운 트렌드, 경쟁사가 뛰어난 점분석 수행 방법내부 요인 고려(이해 관계자와 논의 및 계획 수립)외부 요인 평가(시장 트렌드 대응 및 예측)아이디어를 창출하고 순위를 매김 2024. 8. 8.
[TIL]본캠프 79일차 데이터 마트와 데이터 웨어하우스데이터 웨어하우스: 분산된 환경에 흩어져 있는 데이터들을 개인이나 조직이 총체적인 관점에서 의사결정을 위해 공통의 형식으로 변환해 관리하는 역할데이터 마트: 데이터 웨어하우스로부터 추출된 작은 데이터베이스, 특정 목표를 달성하기 위한 데이터 제공SQL 언어DDL(데이터 정의 언어): CREATE, ALTER, RENAME, DROPDML(데이터 조작 언어): SELECT, INSERT, UPDATE, DELETEDCL(데이터 조작 언어): GRANT, REVOKETCL(트랜잭션 제어 언어): COMMIT, SAVEPOINT, ROLLBACKK-Means 알고리즘데이터를 K개의 군집으로 나누고, 각 군집의 중심을 반복적으로 업데이트하여 최적의 군집을 형성군집의 수를 미리 설정.. 2024. 8. 7.
[TIL]본캠프 77일차 & 78일차 최종 프로젝트 중간 발표 기간Robust Scaling데이터의 중앙값을 뺀 다음, 사분위수 범위로 나누어 스케일링 하는 것이상치에 덜 민감한 스케일링을 할 때 유용변환 값 = {해당 값 - 중앙값(Median)} / IQR서로 다른 특성 간에 일관된 스케일을 유지하여 알고리즘이 각 특성을 공정하게 처리할 수 있도록 함Log Transformation로그 변환을 통해 왜도와 첨도를 가진 변수를 정규분포에 가깝게 만들어줌작은 수는 크게, 큰 수는 작게 변환정규성 검정(Normality Test)데이터셋의 분포가 정규 분포를 따르는지 검정하는 것여러 검정법들이 데이터의 정규 분포를 가정하고 수행되기 때문에, 데이터 자체의 정규성을 확인하는 검정과정Shaprio-Wilks Test : 표본 수가 2000 미만인.. 2024. 8. 6.
728x90