본문 바로가기
Data/[SeSAC 성동1기 전Z전능 데이터 분석가]

[성동 1기 전Z전능 데이터 분석가] Day 30

by MIN_JOON 2023. 11. 26.
  • 파이썬(Python)?
    • 소프트웨어 개발: 범용 프로그래밍 언어로 기업 실무를 위해서도 많이 사용한다. 시스템 소프트웨어를 만드는데 유리하다.
    • GUI프로그래밍을 위한 도구들: 웹 프로그램을 만들기에 매우 적합하며, 데이터베이스에 접근하고 프로그래밍하기 위한 다양한 도구를 제공한다.
    • 비교적 배우기 쉽고 간단하다는 장점이 존재한다.
    • 오픈소스로 누구나 무료로 사용/복제/배포/수정/상업화가 가능하다.
    • 사용가능한 내장 함수 및 외부 라이브러리가 굉장히 많으며 다양한 언어들과도 쉽게 융합이 가능하다.
  • 파이썬을 이용한 데이터 분석
    • 통계분석
    • 시각화
    • 머신러닝 모델링
    • 비정형 데이터 분석
  • 아나콘다
    • 데이터 분석을 하는데 필요한 여러가지 소프트웨어를 쉽게 설치해주는 프로그램이다.
    • 데이터 분석을 위한 환경설정을 용이하게 해준다.

  • 변수
    • 다양한 자료형의 값을 저장하는 공간
    • 변수를 만들 때는 =(assignment)기호를 사용한다.
  • 파이썬의 자료형
    1. 숫자형: 숫자 형태로 이루어진 자료형으로 정수, 실수, 8진수, 16진수 등이 존재
      • 사칙연산(+,-,*,/)이나 제곱 연산(**), 나머지 연산(%), 몫 연산(//)이 가능하다.
    2. 문자열(String): 문자들의 집합
      • 따옴표로 둘러싸여 있으면 문자열로 취급한다. 
      • 연속된 따옴표 3개로 여러 줄의 문자가 출력되게 할 수 있다.
      • 문자열의 덧셈 및 곱셈이 가능하다. 
      • 문자열 인덱싱은 0부터 시작한다. (apple이라면 0,1,2,3,4로 설정됨)
      • 문자열 포매팅: 문자열 안에 변수를 삽입하는 것
        %s(문자열), %c(문자 1개), %d(정수), %f(부동 소수), %o(8진수), %x(16진수), %%("%"문자 자체)
        ex) "I eat %d apples!"  %3  → "I eat 3 apples!"로 출력
         
      • 문자열 내장 함수
        • a.count(b): a 문자열 중 문자 b의 개수 반환
        • a.find(b): a 문자열 중 문자 b가 처음으로 나온 위치 반환
        • a.join(b): b 문자열의 각각 문자 사이에 a를 삽입
        • a.upper(): a 문자열을 대문자로 변환
        • a.lower(): a 문자열을 소문자로 변환
        • a.strip(): a 문자열의 양 옆 공백을 모두 제거
        • a.replace(b,c): a 문자열의 b를 c로 대체
        • a.split(b): a 문자열을 b를 기준으로 분할
    3. 리스트(List): 여러 요소의 모음
      • 대괄호로 감싸주고 각 요소값은 쉼표로 구분한다.
      • 어떠한 자료형도 포함시킬 수 있다.(리스트 내에 리스트가 포함될 수도 있음)
      • 리스트도 문자열과 동일한 인덱싱을 사용한다.
      • 리스트 내장함수
        • append(x): 리스트 맨 마지막에 x를 추가
        • sort(): 리스트의 요소를 순서대로 정렬
        • reverse(): 리스트를 역순으로 변환
        • index(x): 리스트에 x값이 있으면 그 x값의 인덱스를 반환
        • insert(a,b): 리스트의 a번째 위치에 b를 삽입
        • remove(x): 리스트에서 처음으로 나오는 x를 삭제
        • pop(): 리스트 맨 마지막 요소를 반환하고 해당 요소를 리스트에서 삭제
        • count(x): 리스트 내에 x 요소의 개수를 리턴
        • extend(x): 리스트에 x리스트를 더하기
    4. 튜플(Tuple)
      • 리스트와 비슷하지만 요소값을 바꿀 수 없다.
      • 소괄호로 감싸주고 각 요소값은 쉼표로 구분한다.
      • 1개의 요소만을 가질 때 요소 뒤에 반드시 쉼표를 붙여주어야 한다. 
        ex) t1 = (1,)
    5. 딕셔너리(Dictionary)
      • key와 value를 한 쌍으로 가지는 자료형
      • key:value 형태로 이루어진 각각의 요소가 중괄호로 둘러싸인 형태
      • 딕셔너리 내장함수
        • keys(): 딕셔너리의 key값을 dict_keys 객체로 리턴
        • values(): 딕셔너리의 value값을 dict_values 객체로 리턴
        • items(): key와 value의 쌍을 튜플로 묶은 값을 dict_items 객체로 리턴
          (위 세개 모두 리스트가 아니기 때문에 리스트로 사용하려면 list()함수를 이용하여야 한다.)
        • clear(): 딕셔너리 내의 모든 요소를 삭제
        • get(x): x라는 key에 대응되는 value를 리턴
        • in x: x가 딕셔너리 안에 있는지 여부를 리턴