일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 주가데이터
- 데이터 분석
- sklearn
- 커리어전환
- 주요 파라미터
- 판다스
- 파이썬
- 퀀트 투자 책
- 데이터사이언티스트
- 사이킷런
- 데이터분석
- 과제전형
- 주식데이터
- 머신러닝
- 하이퍼 파라미터 튜닝
- pandas
- 대학원
- 데이터사이언스
- 경력기술서 첨삭
- 데이터사이언스학과
- 코딩테스트
- 데이터 사이언스
- 퀀트
- AutoML
- 이력서 첨삭
- 경력 기술서
- 하이퍼 파라미터
- 랜덤포레스트
- 데이터 사이언티스트
- 자기소개서
- Today
- Total
목록데이터사이언스/커리어 (32)
GIL's LAB
데이터 분석 실무에서는 우리가 예상하지 못한 다양한 문제를 해결해야 합니다. 경험이 많은 데이터 분석가나 데이터 사이언티스트조차 매일 검색하면서 업무를 수행합니다. 이때 중요한 것은 어떤 키워드로 검색해야 하는지(구글링), 그리고 어떤 프롬프트를 써야 하는지(ChatGPT 활용)를 아는 것입니다. 1. ChatGPT를 활용하면 어떤 업무 효율을 높일 수 있을까?ChatGPT는 다양한 업무에서 효율을 높이는 데 유용하게 사용될 수 있습니다.새로운 개념 이해예: "결정 트리가 뭐야? 초보자도 이해할 수 있게 설명해줘"코드 리뷰 및 최적화예: "이 코드에서 에러가 발생하는 이유가 뭐고 어떻게 해결할 지 알려줘"코드 작성 지원예: "이 데이터에서 고객 이탈률을 계산하는 MySQL 쿼리를 작성해줘"브레인스토밍예:..
최근 데이터 분석가(Data Analyst; DA)와 데이터 사이언티스트(Data Scientist; DS)를 채용하는데 있어 과제 전형을 포함시키는 회사가 늘어났습니다. 이번 포스팅에서는 이러한 과제 전형을 대비하기 위한 방법에 대해 알아보겠습니다. DA/DS 과제 전형의 목적: 무엇을 평가할까?DA/DS 과제 전형의 목적은 당연히 입사해서 업무를 잘 수행할 수 있을지를 평가하기 위한 것입니다. 그러나 하나의 과제만 보고 개인의 역량을 제대로 평가하기는 쉽지 않습니다. 그래서 답안지를 보기보다 문제 풀이 과정을 봅니다. 즉, 정답을 찾는지, 화려한 스킬을 쓰는지를 보는 것이 아니라 논리적인 접근 방식과 문제 해결 능력을 평가하는 것이 핵심입니다. 따라서 높은 모델 정확도를 달성하는 것보다, 문제를 어..
문제경찰청에서는 매년 말 지역별 범죄 발생 통계를 발표합니다. 2018년부터 2022년까지 5년치 데이터가 있으며, 각 데이터는 경찰청_범죄 발생 지역별 통계_20181231.csv 등에 저장되어 있습니다 (출처). 해당 데이터를 이용하여 다음 분석을 수행하세요. 단, 결측이나 공백은 0을 나타냅니다. 문제 (1) 2018년부터 2022년까지 서울, 부산, 대구, 인천, 광주, 대전, 울산, 세종의 사기 범죄 추세를 시각화하세요. 문제 (2) 2018년부터 2022년까지 경기도에서 발생한 강력 범죄 추세를 시각화하세요. 문제 (3) 전체 범죄 건수가 매년 감소한 지역의 범죄 발생 건수 추이를 시각화확인하세요. 문제 (4) 2022년에 전체 범죄 발생 가운데 마약범죄 발생 비율이 가장 높은 상위 10..
안녕하세요. 근 1년만의 포스팅입니다. 이번 포스팅에서는 경력 기술서 내의 프로젝트 기술서를 작성하는 방법에 대해 알아보겠습니다. 가장 중요한 것은 제 3자인 평가자가 기술서를 본다는 점을 감안해야 한다는 것입니다. 기술서 구조 기술서는 다음과 같은 구조로 작성하는 것이 좋습니다. 프로젝트명, 기간 (개월수) 프로젝트 개요 주요 수행 내용 업무 성과 획득 역량 각 항목에 대해 자세히 알아보겠습니다. 프로젝트명 프로젝트명은 가급적 구체적으로 작성해줘야하며, 그 뒤에 기간을 명시해줘야 합니다. 가상의 프로젝트(주가 예측 알고리즘 개발)를 다음과 같이 쓸 수 있을 것입니다. 주가 예측 알고리즘 개발, 2023.06 ~ 2024.12 (1년 6개월) 기간 옆에 몇 개월짜리인지를 써주는 것이 평가자가 보기 편합니..
오랜만에 포스팅입니다. 최근 저희 회사에서 신입 데이터사이언티스트 2명을 채용하고 있고, 평가 위원으로 들어가게 됐습니다. 지금은 막 서류를 검토하고 면접에 올릴 인원을 선정하는 단계인데, 생각보다 엄청나게 많은 지원자가 몰려 일이 밀리고 있습니다. 정확한 경쟁률을 밝히기는 어려우나 300:1을 넘습니다. 그리고 인사팀에서 1차로 필터링을 해서 주지만, 그래도 현업 데이터사이언티스트 한 명이 봐야할 지원서만 백장을 넘습니다. 그러다보니 각자의 기준을 만들고 면접에 올릴 가능성이 없는 지원자는 빠르게 낮은 점수를 부여합니다 (지원자 입장에선 억울할 수 있지만, 결국 뽑는건 두 명 뿐이니 합격 가능성이 낮은 지원자는 빠르게 검토할 수 밖에 없습니다). 그리고 최근에는 현업에서 서류를 직접 검토하는 일이 많은..

이번 포스팅에서는 대학원 입학 자기소개서 작성시에 많은 분들이 놓치는 사항에 대해 간단히 알아보겠습니다. 여기서는 이공계 일반 대학원에 석사 과정으로 지원하고자 하는 분에게 한정했으며, 문과 혹은 박사 과정에게는 유효하지 않을 수 있습니다. 대학원은 뭘 하는 곳인가? 대학원은 연구를 하는 곳입니다. 간혹 무엇을 더 배우기 위해 대학원에 가겠다라는 분들이 있는데, 대학원에서는 특별한 무언가를 가르쳐주지 않습니다. 학부 과정에서는 여러 수업을 듣고 좋은 학점을 받는 것이 지상 목표였겠지만, 석사 과정부터는 수업을 들어서 무엇을 배운다기보다 자신의 연구에 필요한 것을 스스로 찾아서 공부하는게 중요합니다. 물론 대학원도 수업이 개설되지만 학부때에 비해 크게 신경쓰지 않습니다. 따라서 무엇을 더 배우기 위해 진학..

문제 accident_stat.xlsx는 교통사고 유형별 교통사고 사고건수, 사망자수, 중상자수 등을 요약한 데이터이다. 이 데이터를 활용하여 아래에 답하시오. (1) 사고유형대분류가 "차대차"인 사고유형별 사망비율을 막대 그래프로 시각화하시오. 단, 사망비율은 사망자수/사고건수로 계산하며, matplotlib에서 폰트는 아래 코드를 이용하여 맑은 고딕으로 설정합니다. from matplotlib import pyplot as plt plt.rcParams['font.family'] = 'Malgun Gothic' (2) 사고유형대분류별로 사망자수가 가장 많은 사고 유형을 출력하세요. 그 결과는 ['횡단중', '측면충돌', '공작물충돌']이어야 합니다. (3) 사고유형별 중상비율을 계산하고 중상비율이 5..

문제 PM10_seoul.csv는 12월 1일 1시부터 8일 24시까지 한 시간마다 측정한 미세먼지 농도(PM-10) 데이터이다. date 컬럼은 측정 시간(YYYY-MM-DD:HH)를 나타내며, PM-10은 미세먼지 농도를 나타낸다. 이 데이터를 활용하여 아래에 답하시오. (1) 시간에 따른 미세먼지 농도를 적절한 그래프로 시각화하세요. 단, x축 이름은 date, y축 이름은 PM-10이어야 합니다. (2) 시간대별 평균 미세먼지 농도를 계산하세요. 즉, t시(t=1,2,…,24)의 평균 농도를 구하시오. (3) 시점 t의 미세먼지 농도를 시점 t-1, t-2, t-3, t-4의 농도를 이용하여 예측하는 모델을 학습하기 위한 데이터를 구성하세요. 예를 들어, 8일 24시의 미세먼지 농도를 8일 20 ..
이전 포스팅에서 이야기한 바와 같이, 데이터 분석가와 데이터 사이언티스트에게 컴퓨터공학에서 다루는 알고리즘을 물어보는 코딩테스트는 난이도가 매우 낮거나 치루지 않는 경우가 많습니다.아무래도 코딩테스트가 아니라 분석 능력을 봐야 하니까 최소한만 보는 경우가 있는 것으로 보입니다.SK C&C와 CJ올리브네트웍스와 같은 기업들에서는 이러한 분석 능력을 보기 위해 데이터 분석가만을 위한 코딩테스트를 시행하고 있습니다. 주어진 시간 내에 간단한 데이터 핸들링과 모델링을 보는게 목표라고 할 수 있습니다.반면, 시간을 더 넉넉히 주고 사전 과제를 주는 경우도 있습니다. 서론이 길었는데 데이터 분석과와 사이언티스트 직무를 희망하는 사람이 풀어볼 수 있는 문제 은행을 만들어볼까 합니다.당연히 길스랩 블로그에 올릴 예정..

이번 포스팅에서는 데이터 사이언티스트 관련 채용 공고를 분석하여, 데이터사이언티스트 취업을 위해 필요한 것들을 알아보겠습니다. 분석에 사용한 채용 공고는 21건이며, 신입 혹은 5년 이내 경력직 공고만 사람인과 원티드를 통해 수집했습니다. 채용 공고에서 자격요건과 우대사항을 다음과 같이 정리했습니다. (예시) 마켓컬리 자격요건 • 물류 및 이커머스 도메인에 대한 관심이 많고, ML/DL 모델링에 기반한 프로젝트 실무를 경험하신 분 • 물적/인적 자원의 효율적인 배분 전략 및 최적화 기법, 혹은 마케팅 효율화/타게팅, 개인화 추천/랭킹 모델 등에 관심이 있으신 분 • 중급 이상의 Python, SQL 프로그래밍 역량과 ML 알고리즘과 성능지표에 대한 이해를 갖추신 분 우대사항 • 결과와 과정에 대한 논리적..