Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 퀀트 투자 책
- 주가데이터
- 데이터사이언티스트
- 퀀트
- 경력 기술서
- 사이킷런
- 파이썬
- sklearn
- 데이터 사이언스
- 하이퍼 파라미터
- AutoML
- 대학원
- 판다스
- 베이지안 최적화
- 주요 파라미터
- 자기소개서
- 머신러닝
- 데이터사이언스학과
- 데이터사이언스
- 파라미터 튜닝
- 경력기술서 첨삭
- 하이퍼 파라미터 튜닝
- pandas
- 코딩테스트
- 랜덤포레스트
- 이력서 첨삭
- 데이터분석
- 주식데이터
- 데이터 사이언티스트
- 커리어전환
Archives
- Today
- Total
목록클래스 불균형 문제 탐색 (1)
GIL's LAB
클래스 불균형 문제 (2) 탐색 방법
1. 클래스 불균형 비율 클래스 불균형 문제가 있는지를 탐색하는 가장 직관적이고 쉬운 방법은 클래스 불균형 비율(imbalance ratio, IR)을 계산하는 것이다. 클래스 불균형 비율은 다음과 같이 계산할 수 있다. 위 식에서 NM은 다수 클래스 샘플 수를, Nm은 소수 클래스 샘플 수를 나타낸다. 일반적으로 이 비율이 9이상이면 클래스 불균형 문제가 심각하다고 하며, 4이상 9이하면 클래스 불균형 문제가 있다고 하고, 4미만이면 클래스 불균형 문제가 없다고 한다. 파이썬을 이용한 클래스 불균형 비율 계산 이제 파이썬을 이용하여 클래스 불균형 비율을 직접 계산해보자. 클래스 불균형 비율을 계산하는 방법은 여러가지지만, 여기서는 Pandas의 value_counts()를 활용한다. 가장 먼저 데이터를..
데이터사이언스/머신러닝
2021. 9. 2. 17:50