Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 퀀트 투자 책
- 경력 기술서
- 주식데이터
- 판다스
- sklearn
- 코딩테스트
- 주가데이터
- 데이터 사이언스
- 데이터 사이언티스트
- 대학원
- 자기소개서
- 파이썬
- 이력서 첨삭
- 파라미터 튜닝
- 데이터분석
- 데이터사이언티스트
- 하이퍼 파라미터 튜닝
- 퀀트
- 하이퍼 파라미터
- 랜덤포레스트
- pandas
- 머신러닝
- 주요 파라미터
- 베이지안 최적화
- 경력기술서 첨삭
- 사이킷런
- 데이터사이언스학과
- 커리어전환
- 데이터사이언스
- AutoML
Archives
- Today
- Total
목록Recall (1)
GIL's LAB
클래스 불균형 문제 (2) 탐색 방법
1. 클래스 불균형 비율 클래스 불균형 문제가 있는지를 탐색하는 가장 직관적이고 쉬운 방법은 클래스 불균형 비율(imbalance ratio, IR)을 계산하는 것이다. 클래스 불균형 비율은 다음과 같이 계산할 수 있다. 위 식에서 NM은 다수 클래스 샘플 수를, Nm은 소수 클래스 샘플 수를 나타낸다. 일반적으로 이 비율이 9이상이면 클래스 불균형 문제가 심각하다고 하며, 4이상 9이하면 클래스 불균형 문제가 있다고 하고, 4미만이면 클래스 불균형 문제가 없다고 한다. 파이썬을 이용한 클래스 불균형 비율 계산 이제 파이썬을 이용하여 클래스 불균형 비율을 직접 계산해보자. 클래스 불균형 비율을 계산하는 방법은 여러가지지만, 여기서는 Pandas의 value_counts()를 활용한다. 가장 먼저 데이터를..
데이터사이언스/머신러닝
2021. 9. 2. 17:50