일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 경력기술서 첨삭
- 주식데이터
- 이력서 첨삭
- 판다스
- pandas
- 베이지안 최적화
- 머신러닝
- 주요 파라미터
- 코딩테스트
- 데이터사이언티스트
- 데이터사이언스
- 하이퍼 파라미터
- 데이터분석
- 파이썬
- 랜덤포레스트
- 경력 기술서
- 자기소개서
- 데이터 사이언스
- 대학원
- 퀀트 투자 책
- AutoML
- 데이터 사이언티스트
- 주가데이터
- 하이퍼 파라미터 튜닝
- 사이킷런
- sklearn
- 커리어전환
- 데이터사이언스학과
- 파라미터 튜닝
- 퀀트
- Today
- Total
GIL's LAB
데이터사이언티스트 취업을 위해 준비해야할 것들 본문
이번 포스팅에서는 데이터 사이언티스트 관련 채용 공고를 분석하여, 데이터사이언티스트 취업을 위해 필요한 것들을 알아보겠습니다.
분석에 사용한 채용 공고는 21건이며, 신입 혹은 5년 이내 경력직 공고만 사람인과 원티드를 통해 수집했습니다.
채용 공고에서 자격요건과 우대사항을 다음과 같이 정리했습니다.
(예시) 마켓컬리
자격요건
• 물류 및 이커머스 도메인에 대한 관심이 많고, ML/DL 모델링에 기반한 프로젝트 실무를 경험하신 분
• 물적/인적 자원의 효율적인 배분 전략 및 최적화 기법, 혹은 마케팅 효율화/타게팅, 개인화 추천/랭킹 모델 등에 관심이 있으신 분
• 중급 이상의 Python, SQL 프로그래밍 역량과 ML 알고리즘과 성능지표에 대한 이해를 갖추신 분
우대사항
• 결과와 과정에 대한 논리적이고 명확한 커뮤니케이션 능력과 데이터 시각화의 기본 개념을 갖추신 분
• 대용량 데이터 처리/분석를 위한 분산처리 프레임워크에 대한 이해도를 갖추신 분
• Git을 통한 코드 관리에 익숙하고 Tableau 대시보드 사용 경험이 있으신 분
참고로 자격요건과 우대사항을 다 충족하지 못하더라도 지레 겁먹고 지원을 피하지는 않았으면 합니다. 자격요건과 우대사항은 기업이 원하는 일종의 이상형같은 것이라서 모든 것을 충족하는 지원자는 사실 그리 많지 않습니다. 우대사항은 더 그렇구요.
데이터 정제
원본 데이터는 분석하기 부적절한 구조를 가지고 있으므로, 주요 단어를 추출했습니다.
멋있게 자연어처리 기법을 쓸까했었는데, 손으로 하는게 더 빠르고 정확할 것 같아 일일이 손으로 변환했습니다.
가령 마켓컬리의 자격요건은 다음과 같이 변환했습니다.
여기서 구분은 관심, 경험, 직무스킬, 성향, 학위로 구분했으며, 실질적으로 검증 가능한 내용은 직무스킬, 경험, 학위라고 볼 수 있습니다.
또한, 지나치게 추상적인 표현(예: "데이터를 관리 및 분석하고 비즈니스 문제 해결을 위해 다양한 기술을 적용할 수 있는 분")은 분석 대상에 포함하지 않았습니다.
자격요건 분석
중복을 허락했을 때 21개 회사에서 요구한 자격요건은 총 107개입니다.
구분별로 살펴보겠습니다.
직무스킬
직무스킬과 관련된 자격요건 분포는 다음과 같습니다.
파이썬
자격요건 - 직무스킬에서 가장 높은 순위를 차지한 것은 파이썬입니다. 이를 통해 알 수 있는 것은 데이터 사이언스 취업 준비를 위해서 파이썬 공부는 필수라는 것입니다. 더 나아가서 파이썬을 활용해서 상용 서비스 개발 혹은 오픈 소스에 기여한 경험이 있거나, 패키지를 개발한 경험이 있다면 이력서에 강조하기 좋습니다.
파이썬을 자격 요건으로 내세운 공고를 몇 가지 살펴보겠습니다.
- 아이트럭: Python3 언어 숙련자 및 Numpy, Pandas, scikitlearn 등
- 비스텔리전스: 데이터를 읽고 쓰고 살펴보기 위한 프로그래밍 코딩(예. R, Python, MatLab, TensorFlow 등)의 이해와 활용 능력
- 케이티넥스알: Python과 R을 이용한 Data Analysis Process 수행 가능자.
자격 요건에서는 대부분 파이썬 자체보다 파이썬을 활용한 데이터 핸들링 역량을 강조하고 있습니다.
ML 알고리즘
ML 알고리즘에 대한 이해가 총 10회 등장으로 2등을 차지했습니다. 사실 데이터 사이언티스트는 머신러닝, 통계학, 딥러닝 등을 이용해서 데이터 기반의 서비스를 만드는 일을 주로하므로 그리 놀랄만한 순위는 아닙니다.
ML 알고리즘에 대한 이해를 자격 요건으로 내세운 공고를 몇 가지 살펴보겠습니다.
- 마켓컬리: 중급 이상의 Python, SQL 프로그래밍 역량과 ML 알고리즘과 성능지표에 대한 이해를 갖추신 분
- 카비: ML/DL에 대한 수학적 이해와 통계적 지식 보유자
ML 알고리즘에 대한 이해는 결국 실전에서 어떻게 ML 알고리즘을 활용하느냐와 관련되며, 공부 방법은 아래 포스팅을 참고하기 바랍니다.
https://gils-lab.tistory.com/104
딥러닝 프레임워크
딥러닝 프레임워크(정확히는 머신러닝 프레임워크도 포함)가 8회 등장으로 공동 3등을 차지했습니다. 딥러닝 프레임워크를 자격 요건으로 내세운 공고를 몇 가지 살펴보겠습니다.
- 에이젠 글로벌: 데이터 사이언스 관련 Framework(Pandas, Scikit-learn, Tensorflow, Pytorch 등) 사용에 능숙하신 분
- 교보 문고: Tensorflow, Keras, PyTorch 등 딥러닝 프레임워크을 능숙하게 활용 가능한 분
사용에 능숙하다는 표현을 썼는데, 사실 제 생각에는 딥러닝 엔지니어가 아닌 데이터 사이언티스트는 딥러닝 프레임워크를 이용해서 모델을 만들고 평가할 수 있을 수준만 되면 된다고 봅니다. 너무 겁먹을 필요는 없습니다.
SQL
SQL이 딥러닝 프레임워크와 함께 공동 3등을 차지했습니다.
제 개인적인 생각으로는 경력직 공고와 섞여 있어서 그런 것 아닌가 싶습니다. SQL도 당연히 잘 알아두면 너무 좋지만, 다른 직무 스킬에 비해 입사해서 익히는게 그리 까다롭지 않은 스킬입니다. 그래서 기본적인 문법만 익혀두길 권장합니다.
커뮤니케이션
조금 뜬금없을 수 있는데, 커뮤니케이션 역량이 4등을 차지했습니다.
어떤식으로 채용 공고에 나왔는지 살펴보겠습니다.
- 아이트럭: 원활한 커뮤니케이션 능력을 보유하신 분
- 누비랩: 동료와의 원활한 커뮤니케이션 및 피드백이 가능하신 분
- 비스텔리전스: Visualization, Reporting 관련 문서작성 능력 & 원활한 의사소통 및 적극적인 팀워크
- 버드뷰: 회사 내부 구성원들과 협업 및 다양한 팀과의 원활한 커뮤니케이션이 가능하신 분
사실 커뮤니케이션 역량은 데이터사이언티스트에게 너무 중요한 역량입니다.
이 내용은 아래 포스팅을 참고하길 바랍니다.
https://gils-lab.tistory.com/80
기타
그 외로 통계학에 대한 이해, R, ML 논문 이해 및 구현, 대용량 데이터 처리 등이 등장했습니다. 통계학에 대한 이해는 사실 ML 알고리즘과 비슷한 내용이며, R은 "파이썬이나 R 중 하나 이상 능숙" 등으로 같이 등장합니다. 대용량 데이터 처리는 주로 분산 처리, 하둡 등과 관련된 내용입니다.
경험
경험과 관련된 자격요건 분포는 다음과 같습니다.
누구나 예상할 수 있는 것처럼 ML 프로젝트 경험이 1위이며, 2위와 크게 차이가 납니다.
ML 프로젝트
ML 관련 프로젝트를 주로 수행해야 하는 직무이므로, ML 프로젝트 경험이 1위를 차지했습니다.
ML 프로젝트와 관련된 항목은 다음과 같습니다.
- 교보문고: 프로덕션 레벨의 ML모델 개발 프로세스에 대한 이해 및 프로젝트 경험이 있는 분
- 인터엑스: 머신러닝/딥러닝 프로젝트 (Prediction, Anomaly detection, Classification) 경험자
그리고 교보문고의 항목에서 "프로덕션 레벨"이란 표현에 집중할 필요가 있습니다. 즉, ML을 사용해서 실제 서비스나 제품을 만든 경험은 매우 좋은 필살기로 사용할 수 있습니다.
도메인
도메인 경험은 그 회사의 도메인과 관련된 경험을 말합니다. 이러한 경험이 있으면 당연히 유리하지만, 실질적으로 미리 준비하기가 매우 어렵습니다. 이 부분에 대한 내용은 아래 포스팅을 참고하기 바랍니다.
https://gils-lab.tistory.com/109
도메인 경험과 관련된 항목은 다음과 같습니다.
- 안티그래비티: E-Commerce 및 플랫폼 비즈니스 경험이 있으신 분
학위
경험과 관련된 자격요건 분포는 다음과 같습니다.
- ML/DL 관련 전공: 5건
- 석사 요구: 3건
ML/DL 관련 전공으로는 통계학, 컴퓨터공학, 수학, 산업공학 등이 있습니다. 석사 요구는 보통 석사만 요구하는 경우도 있지만, 석박사를 요구하기도 합니다.
관련된 항목을 살펴보겠습니다.
- 마인즈앤컴퍼니: 딥러닝/머신러닝 등 AI 관련 분야 전공자
- 카비: 석사(대학원) 이상 학위 소지자
- 케이티넥스알: 관련 전공 졸업(통계학, 산업공학, 경영정보학, 컴퓨터공학, 경영학, 경제학 등)
참고로 우대사항이 아닌 자격요건에 학위가 들어가는 경우, 해당 학위가 없으면 지원했을 때 좋은 결과를 얻을 가능성이 매우 희박합니다. 왜냐하면 객관적으로 손쉽게 확인할 수 있는 지표이므로 필터링에 사용될 가능성이 다른 항목에 비해 크기 때문입니다.
우대사항 분석
중복을 허락했을 때 21개 회사에서 요구한 우대사항은 총 78개입니다.
구분별로 살펴보겠습니다.
직무스킬
직무스킬과 관련된 우대사항 분포는 다음과 같습니다.
직무스킬은 주로 자격요건에 많이 분포해있다보니, 각각의 출현 빈도가 매우 낮습니다.
커뮤니케이션은 자격요건에서 5등, 우대사항에서 1등으로 매우 중요한 역량임을 다시한 번 확인할 수 있습니다.
그 다음으로 나온 것이 시각화인데 Tableau도 시각화 툴이라는 것을 감안하면 시각화 빈도가 4회로 커뮤니케이션과 공동 1등입니다. 다만 시각화 역량은 특출난 포트폴리오가 있지 않는 한 강조하기 어렵다는 것이 문제라면 문제겠습니다.
경험
경험과 관련된 우대사항 분포는 다음과 같습니다.
자격요건과 유사하게 ML 프로젝트가 압도적으로 1등이며, 그 외는 각 회사에 특화된 사항이 대부분입니다.
학위
학위와 관련된 우대사항 분포는 다음과 같습니다.
- ML/DL 관련 전공: 11건
- 석사 요구: 8건
학위 관련 항목은 자격요건보다 우대사항에서 더 자주 등장함을 알 수 있습니다. 즉, 학위가 있으면 우대해주겠지만, 없어도 지원 가능한 기업이 더 많다고 조심스레 해석할 수 있습니다.
그렇지만 실제로 서류를 받아보면 석사 학위자가 학사 학위자보다 더 많이 지원합니다 (물론 회사마다 다르겠죠)
데이터 분야 취업 컨설팅/자기소개서 첨삭/이력서 첨삭은 아래 링크로!
'데이터사이언스 > 커리어' 카테고리의 다른 글
[데이터 코딩테스트 대비 #1] 미세먼지 농도 (0) | 2022.12.28 |
---|---|
데이터 분석가와 사이언티스트를 위한 코딩테스트/사전과제 (0) | 2022.12.27 |
데이터 분야 취업을 위한 지원 동기 작성 방법 (0) | 2022.12.12 |
데이터사이언티스트와 코딩테스트 (0) | 2022.12.11 |
취업 전에 도메인 지식을 미리 준비해야 할까? (0) | 2022.12.07 |