Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 이력서 첨삭
- 대학원
- 공공데이터
- 경력 기술서
- 주식데이터
- 데이터사이언스
- 사이킷런
- 경력기술서 첨삭
- 하이퍼 파라미터 튜닝
- 데이터 사이언티스트
- 파이썬
- pandas
- 자기소개서
- 퀀트
- 커리어전환
- 랜덤포레스트
- 퀀트 투자 책
- 데이터사이언티스트
- 데이터 사이언스
- 주가데이터
- 데이터 분석
- 하이퍼 파라미터
- sklearn
- 데이터분석
- 코딩테스트
- 머신러닝
- AutoML
- 판다스
- 과제전형
- 주요 파라미터
Archives
- Today
- Total
목록클래스 불균형 문제 탐색 (1)
GIL's LAB

1. 클래스 불균형 비율 클래스 불균형 문제가 있는지를 탐색하는 가장 직관적이고 쉬운 방법은 클래스 불균형 비율(imbalance ratio, IR)을 계산하는 것이다. 클래스 불균형 비율은 다음과 같이 계산할 수 있다. 위 식에서 NM은 다수 클래스 샘플 수를, Nm은 소수 클래스 샘플 수를 나타낸다. 일반적으로 이 비율이 9이상이면 클래스 불균형 문제가 심각하다고 하며, 4이상 9이하면 클래스 불균형 문제가 있다고 하고, 4미만이면 클래스 불균형 문제가 없다고 한다. 파이썬을 이용한 클래스 불균형 비율 계산 이제 파이썬을 이용하여 클래스 불균형 비율을 직접 계산해보자. 클래스 불균형 비율을 계산하는 방법은 여러가지지만, 여기서는 Pandas의 value_counts()를 활용한다. 가장 먼저 데이터를..
데이터사이언스/머신러닝
2021. 9. 2. 17:50