일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 베이지안 최적화
- 경력 기술서
- 코딩테스트
- 경력기술서 첨삭
- 커리어전환
- 데이터사이언스
- 대학원
- 이력서 첨삭
- 랜덤포레스트
- AutoML
- 주가데이터
- 퀀트 투자 책
- 데이터사이언티스트
- pandas
- 자기소개서
- 데이터 사이언스
- 파라미터 튜닝
- 사이킷런
- sklearn
- 주식데이터
- 주요 파라미터
- 데이터분석
- 판다스
- 퀀트
- 데이터사이언스학과
- 데이터 사이언티스트
- 파이썬
- 머신러닝
- 하이퍼 파라미터 튜닝
- 하이퍼 파라미터
- Today
- Total
목록데이터사이언스/확률 통계 (3)
GIL's LAB
굉장히 오랜만에 포스팅을 올립니다. 요즘에는 줄긴 했으나, 여전히 로또를 추천해준다는 서비스가 있습니다. 애초에 정말 로또 번호를 높은 확률로 예측할 수 있으면 서비스를 만들지말고 로또를 사는게 당연히 합리적인 선택이니, 당연히 신빙성없는 서비스입니다. 그럼 데이터를 보면서 로또 번호 예측이 왜 불가능한지를 알아보겠습니다. 데이터 현재까지의 로또 당첨 번호 데이터는 동행복권 공식 홈페이지에서 다운로드받을 수 있습니다. https://dhlottery.co.kr/gameResult.do?method=byWin&wiselog=H_C_1_1 로또6/45 - 회차별 당첨번호 1078회 당첨결과 (2023년 07월 29일 추첨) 당첨번호 6 10 11 14 36 38 1078회 순위별 등위별 총 당첨금액, 당첨게..
이번 포스팅에서는 scipy를 이용하여 확률 분포에서 샘플링하는 방법에 대해 알아보겠습니다. 확률 분포 샘플링이란? 샘플링(sampling)이란 특정한 확률 분포에서의 확률을 바탕으로 샘플을 추출하는 작업을 말합니다. 통계에서는 모집단에서 일부를 임의로 선택하는 작업을 샘플링이라 하지만, 여기서는 주어진 확률 분포에서의 샘플링으로 한정하겠습니다. 샘플링은 확률 분석 뿐만 아니라, 머신러닝 및 딥러닝 등에서도 자주 활용되는 개념입니다. numpy.random.choice를 이용한 샘플링 간단히 예를 들어서 주사위를 던져서 나오는 숫자를 샘플링한다고 해보겠습니다. 이 숫자는 {1, 2, 3, 4, 5, 6} 중 하나를 취할 확률이 1/6인 확률 변수를 따릅니다. 참고로 확률 변수가 가질 수 있는 값의 집합을..
이번 포스팅에서는 여러 파라미터 가운데 반응 변수에 가장 큰 영향을 주는 파라미터를 찾는 방법에 대해 알아보겠습니다. 문제 상황 다음과 같이 파라미터 x1, x2, x3가 있고, 파라미터 값에 따른 반응 변수 y가 있다고 하겠습니다. 행 번호 x1 x2 x3 y 1 1 a 5 10 2 1 a 10 10 3 1 b 5 20 4 1 b 10 20 5 2 a 5 25 6 2 a 10 30 7 2 b 5 10 8 2 b 10 15 9 3 a 5 20 10 3 a 10 10 11 3 b 5 30 12 3 b 10 40 x1은 {1, 2, 3}, x2는 {a, b}, x3은 {5, 10}을 순회하면서 설정했고, 그에 따른 y가 있는 것을 알 수 있습니다. 이 데이터에서 궁금한 것은 y에 가장 큰 영향을 끼치는 파라..