본문 바로가기
728x90

분류 전체보기163

[TIL]본캠프 8일차 group_concatMySQL에서 열 병합을 위한 함수group_concat(컬럼명 separator 구분자)distinct를 통해 중복항을 제거하고 합칠 수 있음#group_concat 예시(고객이 주문한 제품을 한 행으로 합치기)select customer_id, group_concat(distinct product_name separator '/')from Productgroup by customer_idcustomer_idproduct_name1mango1milk2beer3chocolatecustomer_idgroup_concat(distinct product_name separator '/')1mang.. 2024. 4. 24.
[1주차]2차시 concatenate 연산 파이썬 Numpy 라이브러리를 이용해 계산 가능 여러 개의 배열을 연결하여 하나의 배열로 만들어줌 기본 문법 : np.concatenate((arr1, arr2, ...), axis=0) 첫 번째 인자로 연결할 배열들의 튜플이나 리스트 입력 두 번째 인자로 축(axis) 설정(0일 경우 열방향, 1일 경우 행방향) #concatenate 예시 matrix1=np.array([[5,7], [9,11]]) matrix2=np.array([[2,4], [6,8]]) result1=np.concatenate((matrix1,matrix2),axis=0) result2=np.concatenate((matrix1,matrix2),axis=1) Numpy를 이용한 유클리드 거리 Numpy .. 2024. 4. 23.
[TIL]본캠프 7일차 기초 통계 용어 평균: 일반적인 평균은 산술 평균을 의미, 데이터를 요약할 때 가장 대표적으로 사용 중앙값: 평균이 치우쳐있는지를 확인할 수 있음, 순서대로 나열했을 때 가운데 위치한 값 최빈값: 가장 빈번하게 등장하는 값 분산: 데이터의 흩어진 정도를 나타냄 표준편차: 데이터의 흩어진 정도를 나타냄, 분산의 양의 제곱근 백분위수: 순서대로 정렬했을 때 특정 백분율 위치에 있는 데이터 값 첨도: 자료가 얼마나 밀집해 있는지를 나타냄 왜도: 확률분포의 비대칭도를 측정하는 지표(양수인 경우 왼쪽으로 밀집, 음수인 경우 오른쪽으로 밀집) 상관분석: 두 변수가 함께 움직이는 방향과 그 크기에 대한 분석(두 변수가 같이 증가하면 양의 상관, 한 변수가 증가할 때 나머지 하나가 감소하면 음의 상관) 공분산: 두 변.. 2024. 4. 23.
[1주차]1차시 분류(Classification) 예측해야할 대상의 개수가 이미 정해져 있는 문제 회귀(Regression) 예측해야할 대상이 연속적인 숫자인 경우 혼돈행렬(Confusion Matrix) 예측과 실제 값 사이의 관계를 행렬 형태로 표현한 것 Confusion Matrix 예측 Negative Positive 실제 Negative TN(True Negative) FP(False Positive) Positive FN(False Negative) TP(True Positive) 정확도(Accuracy) (TP+TN)/(TP+TN+FP+FN) 전체 데이터 중 바르게 분류한 비율 불균형한 데이터에겐 부적합한 평가 지표 정밀도(Precision) TP/(TP+FP) Negative의 중요도가 Positive보다.. 2024. 4. 23.
728x90