일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 파이썬
- pandas
- 데이터 사이언티스트
- 랜덤포레스트
- 하이퍼 파라미터
- 데이터사이언티스트
- 주식데이터
- 대학원
- 커리어전환
- sklearn
- 파라미터 튜닝
- 퀀트
- 주요 파라미터
- 코딩테스트
- 머신러닝
- 판다스
- AutoML
- 사이킷런
- 자기소개서
- 경력 기술서
- 데이터 사이언스
- 데이터사이언스학과
- 베이지안 최적화
- 주가데이터
- 하이퍼 파라미터 튜닝
- 이력서 첨삭
- 경력기술서 첨삭
- 데이터사이언스
- 퀀트 투자 책
- 데이터분석
- Today
- Total
목록코딩테스트 (4)
GIL's LAB
문제 accident_stat.xlsx는 교통사고 유형별 교통사고 사고건수, 사망자수, 중상자수 등을 요약한 데이터이다. 이 데이터를 활용하여 아래에 답하시오. (1) 사고유형대분류가 "차대차"인 사고유형별 사망비율을 막대 그래프로 시각화하시오. 단, 사망비율은 사망자수/사고건수로 계산하며, matplotlib에서 폰트는 아래 코드를 이용하여 맑은 고딕으로 설정합니다. from matplotlib import pyplot as plt plt.rcParams['font.family'] = 'Malgun Gothic' (2) 사고유형대분류별로 사망자수가 가장 많은 사고 유형을 출력하세요. 그 결과는 ['횡단중', '측면충돌', '공작물충돌']이어야 합니다. (3) 사고유형별 중상비율을 계산하고 중상비율이 5..
문제 PM10_seoul.csv는 12월 1일 1시부터 8일 24시까지 한 시간마다 측정한 미세먼지 농도(PM-10) 데이터이다. date 컬럼은 측정 시간(YYYY-MM-DD:HH)를 나타내며, PM-10은 미세먼지 농도를 나타낸다. 이 데이터를 활용하여 아래에 답하시오. (1) 시간에 따른 미세먼지 농도를 적절한 그래프로 시각화하세요. 단, x축 이름은 date, y축 이름은 PM-10이어야 합니다. (2) 시간대별 평균 미세먼지 농도를 계산하세요. 즉, t시(t=1,2,…,24)의 평균 농도를 구하시오. (3) 시점 t의 미세먼지 농도를 시점 t-1, t-2, t-3, t-4의 농도를 이용하여 예측하는 모델을 학습하기 위한 데이터를 구성하세요. 예를 들어, 8일 24시의 미세먼지 농도를 8일 20 ..
이전 포스팅에서 이야기한 바와 같이, 데이터 분석가와 데이터 사이언티스트에게 컴퓨터공학에서 다루는 알고리즘을 물어보는 코딩테스트는 난이도가 매우 낮거나 치루지 않는 경우가 많습니다. 아무래도 코딩테스트가 아니라 분석 능력을 봐야 하니까 최소한만 보는 경우가 있는 것으로 보입니다. SK C&C와 CJ올리브네트웍스와 같은 기업들에서는 이러한 분석 능력을 보기 위해 데이터 분석가만을 위한 코딩테스트를 시행하고 있습니다. 주어진 시간 내에 간단한 데이터 핸들링과 모델링을 보는게 목표라고 할 수 있습니다. 반면, 시간을 더 넉넉히 주고 사전 과제를 주는 경우도 있습니다. 서론이 길었는데 데이터 분석과와 사이언티스트 직무를 희망하는 사람이 풀어볼 수 있는 문제 은행을 만들어볼까 합니다. 당연히 길스랩 블로그에 올릴..
최근 많은 회사에서 개발 직군을 채용할 때 코딩테스트를 봅니다. 코딩테스트 문제는 컴퓨터 사이언스 알고리즘 문제로 좋은 개발자를 뽑기엔 적합할 수 있어도 좋은 데이터 사이언티스트를 뽑기엔 적합하지 않을 수도 있습니다. 실제로 일반 개발직군을 뽑는 코딩테스트를 사용해서 데이터사이언티스트 면접 대상자를 뽑았더니, 분석이 아니라 개발을 잘 하는 사람 위주로만 뽑혀서 난감했던 적도 있습니다. 아무튼 이러한 문제로 데이터사이언스 직군에게는 매우 쉬운 수준의 코딩테스트만 진행하고 있습니다. 그러니 데이터 사이언스 직무 희망자의 경우에 코딩테스트에 너무 목매지 않았으면 좋겠습니다. 실제로 코딩테스트가 어렵기로 소문난 기업에 데이터사이언티스트로 지원해서 코딩테스트를 본적이 있는데, 생각보다 너무 쉬워서 당황했던 경험이..