GIL's LAB

데이터 사이언티스트 / 분석가를 위한 경력 기술서 작성 팁과 첨삭 본문

데이터사이언스/커리어

데이터 사이언티스트 / 분석가를 위한 경력 기술서 작성 팁과 첨삭

GIL~ 2022. 1. 19. 17:08

 

안녕하세요. 

이번 포스팅에서는 실제 경력 기술서를 가지고 첨삭한 내용을 통해, 데이터 사이언티스트와 분석가를 위한 경력 기술서 및 이력서 작성 팁을 정리해보겠습니다. 

 

실제 경력 기술서를 제공해주신 분은 모 중소기업에서 데이터 분석가 혹은 사이언티스트 포지션으로 이직을 희망하시는 분입니다. 

이 분이 제공한 경력 기술서는 워드 파일로 4페이지나 되는 내용이므로, 수정 전/후로 비교해가면서 팁을 정리해보겠습니다. 참고로 워드 파일을 그대로 옮겨오다보니 원래 포맷은 좀 깨질 수 있으며, 식별이 가능한 내용은 전부 xx와 같이 표시했습니다. 

또, 실제 경험이나 역량을 알지 못하므로 제가 어느정도 가상(?)의 인물을 상정한다는 점 양해바랍니다. 

 


 

핵심 역량 부분

말 그대로 핵심 역량이 무엇인지, 나는 다른 지원자들에 비해 어떤 차별화되는 능력과 스킬이 있는지 보여주는 부분입니다. 데이터 사이언티스트와 분석가는 회사와의 핏이 매우 중요하기에 가장 신경써야 하는 부분입니다.

예를 들어, 저희 팀은 팀 특성상 시계열 데이터를 많이 다루므로 시계열 데이터를 분석할 수 있는 역량이 있으면 가점이 되겠지만, 팀과 무관한 컴퓨터 비전과 관련된 역량만 잔뜩 있으면 아무리 뛰어나더라도 저희 팀과 핏이 안 맞기에 뽑을 수 없습니다. 

 

[수정 전]

핵심역량                                                                                                                                             

  • 약 x년 간 Python, SQL, R로 금융, 공정, 중장비 데이터 분석
  • 데이터 시각화 툴 SAP Analytics Cloud를 통한 레포팅 대시보드 구축
  • SAP Data Intelligence, IBM – Cloud For Pak Data 데이터 툴 솔루션 환경 활용
  • 채무 불이행에 필요한 생성한 파생변수 중 영향을 주는 핵심 변수 정리
  • 분석 결과를 근거로 중장비 15% 추가 생산 제안하여 고객 매출 확대에 기여

 

기타사항                                                                                                                                             

보유스킬        Python / R / SQL / MS Office

 

문제점

(1) 역량이 잘 드러나지 않음

(2) 경험과 역량을 섞어쓰고 있음

(3) 보유 스킬을 역량과 연결짓지 않고 기타사항으로 뺐음

 

 

 

[수정 후]

 

핵심역량 및 스킬                                                                                                                                 

  • 데이터 시각화, 통계 분석, 리포팅 역량
  • 커뮤니케이션 및 컨설팅 역량
  • Python: 패키지 개발 가능 수준, R: 패키지 활용 가능 수준, SQL: 속도를 고려한 쿼리 작성 가능 수준
  • 머신러닝 및 딥러닝: 수학적인 내용 이해 및 파이썬으로 구현 가능

 

수정 포인트

(1) 순수한 역량과 스킬만 작성함

(2) 각 스킬의 수준을 강조함

(3) 중요한 순서대로 배치하였음 (데이터 분석가에게 가장 중요한 것은 고객 (내부 고객 포함)과 데이터를 바탕으로 한 커뮤니케이션 역량임)

 

 


 

 

자격 및 교육 부분

사실 데이터 분야에서 자격증은 크게 의미가 없고, 교육도 워낙 그 종류가 많기 때문에 크게 의미가 있는 부분은 아닙니다. 또한, 교육 이름이 워낙 천편일률적이기에 교육에서 어떤 내용을 다뤘는지 정리해주면 도움이 됩니다.

 

[수정 전]

기타사항                                                                                                                                                         

자격사항           ADsP 데이터 분석 준전문가 / 데이터베이스진흥원 (20xx.06)

교육사항           1. Python 데이터 사이언티스트 교육 / 교육기관 A (20xx)

                       2. 데이터 사이언티스트 윈터스쿨 / 교육기관 B (20xx)

                       3. 머신러닝을 위한 빅데이터 분석 전문가 과정 / 교육기관 C (20xx)

 

 

문제점

(1) 기타사항에 너무 많은 것을 몰아넣었음 (어학, 수상, 보유스킬, 개발환경, 자격사항, 교육사항 등)

(2) 교육명이 서로 너무 비슷해서 무엇을 배웠는지 알기 어려움

(3) 교육 수강 기간 등이 포함되지 않음

 

 

[수정 후]

자격 및 교육                                                                                                                                        

  • 데이터 분석 준전문가 (ADSP), 20xx
  • Python 데이터 사이언티스트 교육 (교육기관 A), 20xx.02 - 20xx.03
    • 파이썬을 활용한 통계적 가설 검정, 최적화, 머신러닝 기초 학습
  • 데이터 사이언티스트 윈터스쿨 (교육기관 B), 20xx.02 - 20xx.03
    • 파이썬을 활용한 머신러닝/딥러닝 이론 위주 학습
  • 머신러닝을 위한 빅데이터 분서 전문가 과정 (교육기관 C), 20xx.02 - 20xx.03
    • 머신러닝 파이프라인 구축 학습

 

수정 포인트

(1) 포맷을 통일하고 기간을 추가함

(2) 교육 내용을 추가함

 

 

 


수상 내역

데이터 사이언스 분야는 경진대회 등이 많으므로 수상 내역을 채우기 상대적으로 수월합니다. 그러나 수상 내역이 많지 않다면, 어떻게 수상하게 됐는지 내용을 자세히 풀어주는 것이 좋습니다.

 

[수정 전]

기타사항

수상내역        추계학술발표대회 xx상 / xxxxx학회 (20xx.11)

 

문제점

(1) 수상내역이 하나 밖에 없는데, 무엇을 통해 상을 받았는지에 대한 설명이 너무 빈약함

 

 

[수정 후]

수상내역

  • 추계학술발표대회 xx상 / xxxxx학회 (20xx.11)
    • 주제: ~~~~~~~~~~~~~~~~~~~
    • 내용 소개 1
    • 내용 소개 2
    • 내용 소개 3

 

문제점

(1) 수상 내역에 대한 소개를 추가함 (단, 저도 그 내용을 몰라서 포맷만 추가했습니다.)

 

 

 

 


경력기술서: 프로젝트 1

[수정 전]

1.   xxxxx BI 프로젝트

수행기간 20xx.07 ~ 20xx.12

  • SAP Success Factor 데이터를 SAP Analytics Cloud에서 모델링 작업
  • 레포팅 대시보드 시각화 (리더십 평가, 승계자 현황, 핵심인재 현황, 인원현황, 주재원 현황, 퇴직인원)

실적 및 성과 기여도

  • 5개 레포팅 대시보드 시각화 완료 (리더십 평가, 승계자 현황, 핵심인재 현황, 퇴직현황, 주재원 현황)
  • 4개의 모델 구축 (리더십 리뷰, 핵심인재, 승계자 정보, 주재원 현황)

 

문제점

(1) 정리되지 않은 포맷과 표현

(2) 명확하지 않은 실적 및 기여도 (대시보드를 많이 시각화했거나 하는 것은 뽑는 사람 입장에선 크게 와닿지 않을 가능성이 큼)

 

[수정 후]

4.    xxxxx  BI 프로젝트, 발주처, 20xx.07 ~ 20xx.12

  • SAP Analytics Cloud 환경에서의 분석 리포트 작성
  • 리포트 예시

 

수정 포인트

(1) 군더더기 표현 제거 및 표맷 통일 (프로젝트명, 발주처, 수행 기간)

(2) 시각화 결과 샘플 추가 (리포팅 부분은 그 자체로 성과라고 보기 어려우므로 어떤 리포팅이 가능한지 보여주는 것이 바람직해보임)

(3) 중요한 프로젝트가 아니므로 뒤로 내림

 

 


경력기술서: 프로젝트 2

[수정 전]

1.    XXXX 수요 예측 (발주사)

수행기간 20xx.03~ 20xx.06

  • 판매 지표 중 2008년 리먼 브라더스 사태로 인해 급격한 수요 하락 원인 파악
  • 분기 별 선행/후행 컬럼 생성
  • Machine Line 별 상관계수로 지표 선택
    • 타겟에 영향을 주는 주요 지표 확인(350 : 1, 3분기 선행 미국 외환 보유, 주가지수 등 / 360 : 1인당 GDP, 산업 생산 지수, 총 고용 합계 등)
  • Normalization 변환
  • Machine 350 : 6 ,Machine Line 360 : 6개 주요 변수 선택
    • 350 (주가 지수 선행 / 후행, 외환 보유액 선행 등)
    • 360 (총 고용 합계 선행/후행, 산업생산지수 선행/후행 등)
  •  Machine Line 별 모델 적용
  •  결과
    • 15% 상승 생산량 증가 제안

실적 및 성과 기여도

  • SAP HANA로 최종 테이블 생성
  • Python으로 변수 선택 및 모델링 진행
  • 수요예측 값 오차 15%(Machine Line 350) / 10%( Machine Line 360) 적합도 성과 달성

 

문제점

(1) 정리되지 않은 포맷과 표현 (지나치게 지저분함)

(2) 프로젝트를 직접한 사람이 아니면 이해하기 난해한 내용 (수준이 높아서 이해못하겠음이 아님에 주의!) 다수 포함

(3) 지나치게 지엽적인 내용 포함 (예: Normalization 변환)

(4) 가장 중요한 비즈니스 포인트 (15% 상승 생산량 증가 제안)이 강조되지 않음

 

[수정 후]

2.    XXXX 수요 예측, 발주처, 20xx.03 ~ 20xx.06

  • 통계 분석을 통한 중장비 수요에 주요한 영향을 끼치는 지표(예: 1인당 GDP, 산업생산지수 등) 판별
  • 수요 예측 결과 기반의 생산량에 관한 제언
    • 예측 결과의 신뢰도에 따른 리스크 계산
    • 약 15%의 생산량 증가 제언
  • 확률적 머신러닝 기반의 중장비별 예측 모델링 수행

수정 포인트

(1) 불필요한 내용 싹 제거

(2) 데이터 분석 결과가 의사결정에 어떻게 영향을 주었는지 추가

 

 

 


 

경력기술서: 프로젝트 3

[수정 전]

1. XXXX 채무 불이행 예측

수행기간 20xx.06~20xx.12

  • R, Sap Analytics Cloud 교육 교재 작성 및 강의
  • 채무 불이행 예측 프로젝트 진행
    • 활용 데이터(한국신용정보원 – 개인정보, 대출정보, 연체정보)
    • SQL을 활용하여 90일 이상 연체고객을 Target 데이터 생성
    • 파생변수 500개 생성 – 최대 대출기간, 최소 대출기간, 총 대출 기간, 총 대출 건수, 총 대출 금액, 대출 종류 별 금액 및 기간, 총 연체 건수, 총 연체 금액, 연체 종류 별 금액 및 기간 등
    • NA(연체 기록 없음)는 0으로 변환
    • 시각화를 통한 정성 평가 / Chi-Square, T-test 통계 검정 등 활용한 정량 평가
      • 정성 평가 – 카드론 연체개수, 카드 담보 연체 평균기간, 신용 대출 연체 최소 기간 등
      • 정량 평가 – 신용카드 개설 건수, 신용 최대 대출기간, 카드 개설 기업 가짓수 등
    • Oversampling 기법인 SMOTE를 통해 balanced Label로 변형
    • 최종 변수 – 신용 담보 대출 건수, 최대 연체 기간, 2금융권 연체 기간, 단기카드론 등
      • 신용 담보 대출과 전체 대출 건수가 증가할 때 마다 부도가 약 2배가 증가하며, 연체 기간이 늘어남에 따라 약 채무 불이행이 약 1.3배가 증가 등
      • 2금융권 총 대출 기간이 0에 가까워 질수록 약 3배정도 정상일 확률이 높고, 127일 이상일 수록, 약 6배 정도 부도일 확률이 높음
    • 결과
      • 신용담보 대출 관련 2개 이상인 고객 추가 대출 금지
      • 2금융권 연체 기간 등록 고객 대출 심사 강화
      • 전체 대출 건수 3개 이상 고객 대출 심사 중지
      • 스마트폰 요금 및 카드 연체를 가진 20대 단기카드론 대출 심사 강화

실적 및 성과 기여도

   l   채무 불이행 분류 정확도 85%

   l   채무 불이행 영향에 미치는 조건에 해당하는 고객 대출 심사 전략 방안 설정

 

 

문제점

(1) 정리되지 않은 포맷과 표현 (지나치게 지저분함)

(2) 지나치게 지엽적인 내용 포함 (NA(연체 기록 없음)는 0으로 변환

(3) 교육 자료 작성과 프로젝트 진행 간 밸런스가 맞지 않음 

 

 

[수정 후]

1.     XXXX 채무 불이행 예측, xxxx, 20xx.03 ~ 20xx.06

  • R, Sap Analytics Cloud 교육 교재 작성 및 강의
    • Sap Analytics Cloud를 이용한 리포팅 방법
    • R을 이용한 데이터 정제 방법
  • 채무 불이행 예측 프로젝트 진행
    • EDA를 통한 분석용 데이터 생성: 오버샘플링, 필터링 기반의 특징 선택, 파생 변수 생성 등
    • 채무 불이행 예측 모델링 및 결과 해석
      • 신용 담보 대출과 전체 대출 건수가 증가할 때 마다 부도가 약 2배가 증가하며, 연체 기간이 늘어남에 따라 약 채무 불이행이 약 1.3배가 증가 등
      • 2금융권 총 대출 기간이 0에 가까워 질수록 약 3배정도 정상일 확률이 높고, 127일 이상일 수록, 약 6배 정도 부도일 확률이 높음
    • 모델링 결과를 활용한 의사 결정
      • 신용 담보 대출과 전체 대출 건수가 증가할 때 마다 부도가 약 2배가 증가하며, 연체 기간이 늘어남에 따라 약 채무 불이행이 약 1.3배가 증가 등
      • 2금융권 총 대출 기간이 0에 가까워 질수록 약 3배정도 정상일 확률이 높고, 127일 이상일 수록, 약 6배 정도 부도일 확률이 높음
      • 신용담보 대출 관련 2개 이상인 고객 추가 대출 금지
      • 2금융권 연체 기간 등록 고객 대출 심사 강화
      • 전체 대출 건수 3개 이상 고객 대출 심사 중지
      • 스마트폰 요금 및 카드 연체를 가진 20대 단기카드론 대출 심사 강화

수정 포인트

(1) 불필요한 내용 싹 제거

(2) 밸런스 조정

(3) 프로젝트 진행으로 인한 이득을 최대한 정리

 


데이터 분야 취업 컨설팅/자기소개서 첨삭/이력서 첨삭은 아래 링크로!

https://kmong.com/gig/380507

 

데이터 사이언스 박사가 데이터 분야 취업, 진학을 도와 | 50000원부터 시작 가능한 총 평점 5점의

18개 총 작업 개수 완료한 총 평점 5점인 데이터사이언스박사의 문서·글쓰기, 이력서 교정 서비스를 18개의 리뷰와 함께 확인해 보세요. 문서·글쓰기, 이력서 교정 제공 등 50000원부터 시작 가능

kmong.com

 

Comments