본문 바로가기
Data/[SeSAC 성동1기 전Z전능 데이터 분석가]

[성동1기 전Z전능 데이터 분석가] Day 33

by MIN_JOON 2023. 11. 29.
  • 면접 특강:기업은 표현한만큼 판단하고 평가: 어떻게 표현하는지가 중요하다.
  • 역량: 어떤 직무를 잘 해날 수 있는 개인의 능력
    • 어떤 직무목표에 대한 성과를 내기 위해 이미 축적되어진 개인의 구체적인 지식, 기술, 태도 등을 가지고 맡은 역할을 성공적으로 수행할 수 있는 능력
    • 기본역량: 신입사원으로서 적극적이고 능동적인 태도
    • 직무역량:회사와 직무에 대한 깊은 관심과 흥미, 이해도를 가지고 명확한 직업관을 가지고 있는지 여부
    • 조직역량
  • 면접 평가 3요소
    • 인성과 적성: 태도와 첫 인상(이미지), 인성
    • 직무 전문성: 직무역량, 직무지원동기, 차별성 및 포부
    • 조직 부합성: 조직문화적응력, 팀웍, 협조성, 사교성, 논리적 표현력
  • 면접 사전준비: 기업 및 직무분석& 이해 필수
    • 채용공고 지원자격, 요구역량과 주요업무 이해
    • 산업 기업 직무부서에 대한 기본적인 이해
    • 직무와 필요역량에 대한 충분한 이해
    • 기업과 직무에 맞는 나만의 역량 키워드 정리
  • 면접 유형별 답변 준비
    • 나만의 경험 정리
    • 기본 면접 질문, 기출 면접 질문, 입사지원서 기반 질문 답변 준비
    • 답변 스크립트 만들기
  • 면접 기본기
    • 답변은 30초 이내, 최대 40초 이내로/ 질문 받고 2초의 여유를 둘 것(차분함)
    • 두괄식(보고식 표현): 결론 한 줄부터 던질 것
    • 한번에 다 설명하려하지 말고 면접관이 질문하도록 할 것
    • 30초가 넘는 답변은 30초씩 나눠서 답
  • 답변 구조
    • 결론: 두괄식으로 결론부터 키워드 답변
    • 근거: 답변의 근거가 되는 사례/이유를 들어 공감(상황,액션,결과에 대부분을 소비, 과정은 짧게)
    • 적용: 키워드 답변을 통해 배우고 느끼고 갖추게 된 역량이 지원직무에 어떻게 적용할지 또는 발휘할지 포부를 간략히 표현
    • 전혀 모르는 질문은 생각하는 시간을 잠깐 가지고 아는 것까지 답변할 것, 모르는 것은 모른다고 솔직하게
    • 어정쩡하거나 과장된 답변은 하지 말 것
    • 모든 질문에 답변은 직무,조직,기본 역량을 바탕으로 답변
  • 반드시 준비해야할 것
    • 스크립트: 30초 내외(350~400자), 구어체, 달달 외우지말고 키워드를 기억할 것
    • 1분 자기소개: 1분 안에 회사와 직무에 자신이 뽑혀야 하는 이유를 말한다고 생각
    • 지원동기: 소비자 관점에서 이야기하는 것이나 기준 없이 회사의 강점 혹은 장점만 나열하는 것은 피할 것
    • 직무역량: 직무 재정의 + 역량(결론,근거,적용 순)

  • Python
  • 파생변수: 기존의 변수를 변형해 만든 변수
#변수를 조합해 파생변수 만들기
import pandas as pd
df = pd.DataFrame({'var1':[4,3,8],
                   'var2':[2,6,1]})
df['var_sum']=df['var1']+df['var2']
df['var_mean']=(df['var1']+df['var2'])/2
  • 파생변수 만들기 실습 및 조건문 이용
#통합 연비 변수 만들기
mpg_new=mpg_new.rename(columns={'mf':'manufacturer'})
mpg_new['total']=(mpg['cty']+mpg['hwy'])/2
mpg_new.head()

#파생변수 분석하기
mpg_new['total'].mean()
mpg_new['total'].describe()

#그래프 만들기
mpg_new['total'].plot.hist()
#합격 판정 변수 만들기(np는 numpy)
#total 20이상이면 pass, 아니면 fail
import numpy as np
mpg_new['test']=np.where(mpg_new['total']>=20,'pass','fail')
mpg_new.head()

#연비 합격 빈도표 만들기
mpg_new['test'].value_counts()

#막대 그래프로 빈도 표현하기
count_test=mpg_new['test'].value_counts() #연비 합격 빈도표를 변수에 할당
count_test.plot.bar() #연비 합격 빈도 막대 그래프 만들기
count_test.plot.bar(rot = 0) #축 이름 수평으로 만들기

#연비 등급 변수 만들기
mpg_new['grade']=np.where(mpg_new['total']>=30, 'A' , np.where(mpg_new['total']>=20,'B','C'))
mpg_new.head()

#빈도표와 막대 그래프로 연비등급 살펴보기
count_grade=mpg_new['grade'].value_counts()
count_grade.plot.bar(rot=0)

#알파벳순으로 막대 정렬하기
count_grade = mpg_new['grade'].value_counts().sort_index() #메서드 체이닝: (.)을 이용해 메서드를 계속 이어서 작성하는 방법, 변수에 여러 메서드를 순서대로 적용
count_grade.plot.bar(rot = 0)
  • 메서드 체이닝(method chaining)
    • .을 이용해 메서드를 계속 이어서 작성하는 방법
    • 변수에 여러 메서드를 순서대로 적용
    • 출력 결과를 변수에 할당하고 다시 불러오는 작업을 반복하지 않아도 됨
  • 버티컬바(|): '또는(or)'을 의미하는 기호
#목록에 해당하는 행으로 변수 만들기
mpg_new['size']=np.where((mpg_new['category']=='compact')|(mpg_new['category']=='subcompact')|(mpg_new['category']=='2seater'),'small','large')
count_size=mpg_new['size'].value_counts()
count_size.plot.bar(rot=0)

#df.isin() 활용
mpg_new['size']=np.where(mpg_new['category'].isin(['compact','subcompact','2seater']),'small','large')
count_size=mpg_new['size'].value_counts()
count_size.plot.bar(rot=0)
  • 데이터 전처리
    • 분석에 적합하게 데이터를 가공하는 작업
    • pandas: 전처리 작업에 가장 많이 사용되는 패키지
  • 조건에 맞는 데이터만 추출하기: .query()
import pandas as pd
exam = pd.read_csv('exam.csv'

#nclass가 1인 경우
exam.query('nclass==1')

#nclass가 2인 경우
exam.query('nclass==2')

#수학 점수가 50점 초과
exam.query('math>50')

#1반이면서 수학점수가 50점 이상인 경우
exam.query('nclass==1 & math>=50')

#여러 조건 중 하나 이상 충족하는 행
exam.query('math>=90|english>=90')
exam.query('nclass in [1,3,5]')

#전체 조건에 작은 따옴표, 추출할 문자에 큰 따옴표 사용
df.query('sex=="F"& country=="Korea"')
#전체 조건에 큰 따옴표, 추출할 문자에 작은 따옴표
df.query("sex=='M'& country=='China'")