Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 대학원
- 데이터분석
- 하이퍼 파라미터 튜닝
- 주식데이터
- pandas
- 코딩테스트
- 데이터 사이언티스트
- 하이퍼 파라미터
- 주가데이터
- AutoML
- 데이터사이언티스트
- 경력 기술서
- 사이킷런
- 커리어전환
- 이력서 첨삭
- sklearn
- 자기소개서
- 경력기술서 첨삭
- 판다스
- 데이터사이언스
- 베이지안 최적화
- 머신러닝
- 퀀트
- 데이터사이언스학과
- 주요 파라미터
- 랜덤포레스트
- 파이썬
- 파라미터 튜닝
- 퀀트 투자 책
- 데이터 사이언스
Archives
- Today
- Total
목록Recall (1)
GIL's LAB
클래스 불균형 문제 (2) 탐색 방법
1. 클래스 불균형 비율 클래스 불균형 문제가 있는지를 탐색하는 가장 직관적이고 쉬운 방법은 클래스 불균형 비율(imbalance ratio, IR)을 계산하는 것이다. 클래스 불균형 비율은 다음과 같이 계산할 수 있다. 위 식에서 NM은 다수 클래스 샘플 수를, Nm은 소수 클래스 샘플 수를 나타낸다. 일반적으로 이 비율이 9이상이면 클래스 불균형 문제가 심각하다고 하며, 4이상 9이하면 클래스 불균형 문제가 있다고 하고, 4미만이면 클래스 불균형 문제가 없다고 한다. 파이썬을 이용한 클래스 불균형 비율 계산 이제 파이썬을 이용하여 클래스 불균형 비율을 직접 계산해보자. 클래스 불균형 비율을 계산하는 방법은 여러가지지만, 여기서는 Pandas의 value_counts()를 활용한다. 가장 먼저 데이터를..
데이터사이언스/머신러닝
2021. 9. 2. 17:50