일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 주식데이터
- 데이터사이언스
- 퀀트
- 코딩테스트
- AutoML
- 파이썬
- 데이터사이언티스트
- 커리어전환
- 퀀트 투자 책
- 머신러닝
- 자기소개서
- 대학원
- 데이터분석
- 랜덤포레스트
- sklearn
- 데이터 사이언티스트
- 파라미터 튜닝
- 주가데이터
- 판다스
- 하이퍼 파라미터
- pandas
- 데이터 사이언스
- 이력서 첨삭
- 하이퍼 파라미터 튜닝
- 사이킷런
- 주요 파라미터
- 경력 기술서
- 경력기술서 첨삭
- 데이터사이언스학과
- 베이지안 최적화
- Today
- Total
목록데이터 사이언스 (3)
GIL's LAB
문제 PM10_seoul.csv는 12월 1일 1시부터 8일 24시까지 한 시간마다 측정한 미세먼지 농도(PM-10) 데이터이다. date 컬럼은 측정 시간(YYYY-MM-DD:HH)를 나타내며, PM-10은 미세먼지 농도를 나타낸다. 이 데이터를 활용하여 아래에 답하시오. (1) 시간에 따른 미세먼지 농도를 적절한 그래프로 시각화하세요. 단, x축 이름은 date, y축 이름은 PM-10이어야 합니다. (2) 시간대별 평균 미세먼지 농도를 계산하세요. 즉, t시(t=1,2,…,24)의 평균 농도를 구하시오. (3) 시점 t의 미세먼지 농도를 시점 t-1, t-2, t-3, t-4의 농도를 이용하여 예측하는 모델을 학습하기 위한 데이터를 구성하세요. 예를 들어, 8일 24시의 미세먼지 농도를 8일 20 ..
본 포스팅에서는 데이터 분석 혹은 사이언티스트 취업 준비 시에 도메인 지식을 미리 쌓아야하는지에 관해 간단히 제 생각을 정리해보겠습니다. 도메인 지식이 무엇이고 왜 필요할까? 보통 데이터 분석, 데이터 사이언스 등에서 말하는 도메인 지식은 데이터가 발생한 환경에 대한 지식이라고 할 수 있습니다. 예를 들어, 반도체 제조 공정 데이터를 분석한다면 그 때의 도메인이 반도체가 되는 것이고 도메인 지식은 반도체에 관한 지식이라고 할 수 있습니다. 사실 도메인 지식을 모르더라도 데이터 분석이나 머신러닝 모델링 등을 할 수 있습니다. 예를 들어, 많은 분들이 아이리스 데이터로 높은 정확도의 모델을 만들어본 경험이 있을겁니다. 아래 그림처럼 꽃들의 petal과 sepal의 길이와 두께를 바탕으로 어느 종의 꽃인지를 ..
안녕하세요. 이번 포스팅에서는 주니어가 경력 기술서를 작성할 때 자주하는 실수에 대해 알아보겠습니다. 지금까지 이력서나 경력 기술서를 검토하다가 공통적으로 확인하던 실수여서 짧게 글을 써보고자 합니다. 주니어에게 필요한 것 보통은 석박사 학위 기간을 포함한 경력이 3년 이하인 주니어에게 엄청난 기술 역량을 바라진 않습니다. 주니어도 일당백을 해야 하는 회사가 아니라면, 주니어에게 가장 중요한 것은 입사해서 새로운 프로젝트를 잘 따라올 수 있느냐인 것 같습니다. 새로운 프로젝트를 리딩할 수 있는 역량이 아니라 따라올 수 있는 역량이라는 것입니다. 경험과 경력이 쌓이면 새로운 프로젝트를 리딩할 수 있겠지만, 주니어에게 그 정도를 바라진 않습니다. 새로운 프로젝트를 잘 따라오려면 다른 팀원들과 잘 조화될 수 ..