본문 바로가기
728x90

데이터분석123

[TIL]사전캠프 학습 8일차 데이터 분석 기획 실제 분석을 수행하기 전, 분석을 수행할 과제의 정의 및 결과를 도출할 수 있도록 관리하는 방안을 사전에 계획 어떤 목표(What)를 달성하기 위하여 어떤 데이터를 가지고 어떤 방식(How)으로 수행할지 분석 기획시 고려사항 가용 데이터 고려(Available Data) 분석을 위한 데이터 확보가 우선이며 데이터 유형에 대한 분석이 선행적으로 이루어질 것 적절한 활용방안과 유스케이스의 탐색(Proper Business Use Case) 유사 분석 시나리오 및 솔루션을 최대한 활용할 것 장애요소에 대한 사전 계획 수립(Low Barrier of Execution) 일회성 분석으로 그치지 않고 조직의 역량으로 내재화하기 위해서는 충분하고 계속적인 변화 관리(Change Management).. 2024. 4. 5.
[TIL]사전캠프 학습 7일차 빅데이터 일반적 정의: 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 빅데이터를 보는 관점에 따른 정의 3V(Volume,Variety,Velocity)로 요약되는 데이터 자체의 특성 변화에 초점을 맞춘 좁은 범위의 정의 데이터 자체 뿐만 아니라 처리, 분석 기술적 변화까지 포함하는 중간 범위의 정의 인재, 조직 변화까지 포함한 넓은 관점으로의 정의 4V: 더그 래니(Doug Laney)의 3V에 추가로 Value 또는 Veracity를 포함해 4V로 설명하기도 함 →Visualization이나 Variability를 추가하는 견해도 존재 빅데이터의 출현 배경 산업계: 고객 데이터 축적(양질 전환 법칙, 일정한 양이 누적되면 어느 순간 질적인 비약이 일어남.. 2024. 4. 4.
[TIL]사전캠프 학습 6일차 ADsP 학습 1일차 데이터 저장이나 처리에 효율적인 형태로 변환된 정보 전 세계의 모든 데이터의 90%는 2015년 이후 생성(IBM) 특성 존재적 특성: 있는 그대로의 객관적 사실 당위적 특성: 추론, 예측, 전망, 추정을 위한 근거 유형 정성적 데이터: 언어, 문자 등 정량적 데이터: 수치, 기호, 도형 등 정형 데이터: 고정된 틀이 있으며 연산 가능(CSV, 엑셀, 스프레드 시트 등) 비정형 데이터: 고정된 틀이 없고 연산 불가능(NoSQL, 영상, 음성 등) 반정형 데이터: 고정된 틀이 있지만 연산 불가능(HTML, JSON, XML 등) 암묵지와 형식지 암묵지(Tacit Knowledge): 학습과 체험을 통해 개인에게 습득되어 있지만 겉으로 드러나지 않는 지식으로 공유 불가 형식지(Expli.. 2024. 4. 3.
[TIL]사전캠프 학습 5일차 map함수 기본구조: map(함수, 반복_가능한_자료형) 반복 가능한 자료형(리스트 or 튜플)을 함수에 하나씩 집어 넣어서 함수를 수행해줌 반환되는 값을 리스트나 튜플로 변환시켜주어야 함 #map 함수 사용 def function(n): ......... result=list(map(function,list)) #반환값을 list로 변환 print(result) 람다(lambda) 함수를 간단하게 한줄로 정리해줄 수 있음 기본구조: lambda 매개변수 : 표현식 #일반 함수구조 def sum(x+y): return x + y sum(2+3) #lambda구조 사용 (lambda x,y : x+y)(2,3) filter 함수 map함수와 유사하지만, 해당 조건에서 True인 값들만 뽑아서 사용 #fil.. 2024. 3. 29.
728x90