- 파이썬(Python)?
- 소프트웨어 개발: 범용 프로그래밍 언어로 기업 실무를 위해서도 많이 사용한다. 시스템 소프트웨어를 만드는데 유리하다.
- GUI프로그래밍을 위한 도구들: 웹 프로그램을 만들기에 매우 적합하며, 데이터베이스에 접근하고 프로그래밍하기 위한 다양한 도구를 제공한다.
- 비교적 배우기 쉽고 간단하다는 장점이 존재한다.
- 오픈소스로 누구나 무료로 사용/복제/배포/수정/상업화가 가능하다.
- 사용가능한 내장 함수 및 외부 라이브러리가 굉장히 많으며 다양한 언어들과도 쉽게 융합이 가능하다.
- 파이썬을 이용한 데이터 분석
- 통계분석
- 시각화
- 머신러닝 모델링
- 비정형 데이터 분석
- 아나콘다
- 데이터 분석을 하는데 필요한 여러가지 소프트웨어를 쉽게 설치해주는 프로그램이다.
- 데이터 분석을 위한 환경설정을 용이하게 해준다.
- 변수
- 다양한 자료형의 값을 저장하는 공간
- 변수를 만들 때는 =(assignment)기호를 사용한다.
- 파이썬의 자료형
- 숫자형: 숫자 형태로 이루어진 자료형으로 정수, 실수, 8진수, 16진수 등이 존재
- 사칙연산(+,-,*,/)이나 제곱 연산(**), 나머지 연산(%), 몫 연산(//)이 가능하다.
- 문자열(String): 문자들의 집합
- 따옴표로 둘러싸여 있으면 문자열로 취급한다.
- 연속된 따옴표 3개로 여러 줄의 문자가 출력되게 할 수 있다.
- 문자열의 덧셈 및 곱셈이 가능하다.
- 문자열 인덱싱은 0부터 시작한다. (apple이라면 0,1,2,3,4로 설정됨)
- 문자열 포매팅: 문자열 안에 변수를 삽입하는 것
%s(문자열), %c(문자 1개), %d(정수), %f(부동 소수), %o(8진수), %x(16진수), %%("%"문자 자체)
ex) "I eat %d apples!" %3 → "I eat 3 apples!"로 출력 - 문자열 내장 함수
- a.count(b): a 문자열 중 문자 b의 개수 반환
- a.find(b): a 문자열 중 문자 b가 처음으로 나온 위치 반환
- a.join(b): b 문자열의 각각 문자 사이에 a를 삽입
- a.upper(): a 문자열을 대문자로 변환
- a.lower(): a 문자열을 소문자로 변환
- a.strip(): a 문자열의 양 옆 공백을 모두 제거
- a.replace(b,c): a 문자열의 b를 c로 대체
- a.split(b): a 문자열을 b를 기준으로 분할
- 리스트(List): 여러 요소의 모음
- 대괄호로 감싸주고 각 요소값은 쉼표로 구분한다.
- 어떠한 자료형도 포함시킬 수 있다.(리스트 내에 리스트가 포함될 수도 있음)
- 리스트도 문자열과 동일한 인덱싱을 사용한다.
- 리스트 내장함수
- append(x): 리스트 맨 마지막에 x를 추가
- sort(): 리스트의 요소를 순서대로 정렬
- reverse(): 리스트를 역순으로 변환
- index(x): 리스트에 x값이 있으면 그 x값의 인덱스를 반환
- insert(a,b): 리스트의 a번째 위치에 b를 삽입
- remove(x): 리스트에서 처음으로 나오는 x를 삭제
- pop(): 리스트 맨 마지막 요소를 반환하고 해당 요소를 리스트에서 삭제
- count(x): 리스트 내에 x 요소의 개수를 리턴
- extend(x): 리스트에 x리스트를 더하기
- 튜플(Tuple)
- 리스트와 비슷하지만 요소값을 바꿀 수 없다.
- 소괄호로 감싸주고 각 요소값은 쉼표로 구분한다.
- 1개의 요소만을 가질 때 요소 뒤에 반드시 쉼표를 붙여주어야 한다.
ex) t1 = (1,)
- 딕셔너리(Dictionary)
- key와 value를 한 쌍으로 가지는 자료형
- key:value 형태로 이루어진 각각의 요소가 중괄호로 둘러싸인 형태
- 딕셔너리 내장함수
- keys(): 딕셔너리의 key값을 dict_keys 객체로 리턴
- values(): 딕셔너리의 value값을 dict_values 객체로 리턴
- items(): key와 value의 쌍을 튜플로 묶은 값을 dict_items 객체로 리턴
(위 세개 모두 리스트가 아니기 때문에 리스트로 사용하려면 list()함수를 이용하여야 한다.) - clear(): 딕셔너리 내의 모든 요소를 삭제
- get(x): x라는 key에 대응되는 value를 리턴
- in x: x가 딕셔너리 안에 있는지 여부를 리턴
- 숫자형: 숫자 형태로 이루어진 자료형으로 정수, 실수, 8진수, 16진수 등이 존재
'Data > [SeSAC 성동1기 전Z전능 데이터 분석가]' 카테고리의 다른 글
[성동1기 전Z전능 데이터 분석가] Day 32 (1) | 2023.11.28 |
---|---|
[성동1기 전Z전능 데이터 분석가] Day 31 (1) | 2023.11.27 |
[성동1기 전Z전능 데이터 분석가] Day 29 (1) | 2023.11.26 |
[성동 1기 전Z전능 데이터 분석가] Day 28 (1) | 2023.11.23 |
[성동1기 전Z전능 데이터 분석가] Day 27 (0) | 2023.11.21 |