본문 바로가기
728x90

데이터분석123

[TIL]본캠프 66일차 자연어처리(NLP)자연어란 인간이 의사소통을 위해 쓰고, 듣고, 말하는 모든 형태의 언어복잡한 규칙과 구조로 해당 언어에 익숙하지 않다면 이해하기 어려움컴퓨터가 이해할  수 있는 형식(벡터)으로 데이터를 변환 해주는 것이 자연어 처리자연어를 임베딩하는 인코더(알고리즘, 딥러닝 모델 등) 및 벡터 해석을 위한 디코더(분석, 예측, 생성 등)가 존재자연어를 왜 분석해야할까?수치형 데이터는 계획을 하고 모아야하는 경우가 많음반면 자연어는 서비스의 부산물로 자연스럽게 생성되는 경우가 많음또한 감정, 의도 분석이나 정보 추출 등 다양한 활용 방향성이 존재다음주...!최종프로젝트...! 2024. 7. 19.
[TIL]본캠프 65일차 PoC(Proof of Concept)어떤 아이디어, 제품, 서비스 등의 실현 가능성을 입증하는 프로세스Poc 요소개념 검증: 어떤 개념이나 아이디어가 실제로 동작하며 예상한 대로 기능하는지기술 검증: 새로운 기술의 유효성을 확인하고 어떻게 구현되는지 검토프로토타입 개발: 실제 프로토타입 및 샘플 개발, 테스트 및 피드백 수집비즈니스 유효성 확인: 시장에서 경쟁력이 있는지 확인위험 감소: 실패 가능성이 높은 프로젝트나 복잡한 기술 도입에 대한 위험을 최소화결정 지원: 프로젝트 또는 기술 도입에 대한 정보를 제공하고 적합성을 판단자금 조달: 프로젝트에 대한 논리적 근거를 제시Poc 순서목표 설정: 무엇을 달성하려고 하는지범위 설정: 어떤 기능을 테스트, 어떤 데이터를 수집, 어떤 툴을 사용할지팀 구성자원 .. 2024. 7. 18.
[TIL]본캠프 64일차 API소프트웨어 구성 요소가 서로 통신할 수 있게 하는 방식API를 통해 접근이 허용된 로컬에게만 권한을 부여할 수 있음키값을 통해 간편한 통신을 지원API를 통해 DB 접근 요청을 표준화API키를 발급받아 HTTP API 통신 혹은 REST API규칙으로 소통API 종류Public API: 누구나 사용 가능Private API: 사내에서 사용하는 APIPartner API: 미리 정해놓은 사용자들만 쓰는 APIWindow API: 운영체제 대상 API크롤링과 스크래핑특정 웹 사이트나 페이지에서 필요한 데이터를 자동으로 추출해 내는 것을 의미공통점: 원하는 데이터를 수집할 수 있다는 점차이점: 크롤링은 웹사이트에 대한 정보를 색인화하고 저장, 스크래핑은 분석 및 기타 목적을 위해 데이터를 추출크롤링 주의.. 2024. 7. 17.
[TIL]본캠프 63일차 고객 생애 가치(Lifetime Value)고객이 서비스를 이용하기 시작해서 이탈하기까지 기간 동안 서비스에 얼마의 수익을 가져다 주었는지의 지표LTV = (M-c)/(1-r) - ACM: 1인당 평균 매출(단위: 1년)c: 1인당 들어가는 평균 서비스 비용(단위: 1년)r: 고객 유지 비율AC(Acquisition Cost): 고객 획득 비용위의 식 이외에도 다양한 방식으로 계산 가능고객 생애 매출(Lifetime Revenue)고객당 매출을 빠르게 계산LTR = (해당 고객들의 서비스 이용 기간 동안 발생한 총 매출액)/(특정 고객 집단에 속하는 고객 수)특정 기간에 가입 또는 서비스를 첫 이용한 고객들을 대상으로 고객 집합을 분리하여 계산좀 더 자세하게 유입 채널 별로 나누어 분석지표 계산의 어려움.. 2024. 7. 16.
728x90