일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 코딩테스트
- 자기소개서
- 데이터 사이언스
- 주요 파라미터
- 데이터사이언스
- 커리어전환
- 대학원
- 판다스
- 하이퍼 파라미터
- sklearn
- 주식데이터
- 파라미터 튜닝
- 랜덤포레스트
- 사이킷런
- 파이썬
- 경력 기술서
- 데이터사이언티스트
- 퀀트
- 머신러닝
- 이력서 첨삭
- 데이터사이언스학과
- 데이터분석
- 하이퍼 파라미터 튜닝
- 데이터 사이언티스트
- 주가데이터
- 경력기술서 첨삭
- pandas
- 베이지안 최적화
- 퀀트 투자 책
- AutoML
- Today
- Total
목록scikit-learn (2)
GIL's LAB
NotFittedError는 사이킷런의 모델 인스턴스를 학습하지 않고 활용할 때 발생하는 에러입니다. 간단한 예시를 살펴보겠습니다. 먼저 임의로 데이터를 만들고 LinearRegression 클래스를 이용해서 선형 회귀 모델을 만들겠습니다. import numpy as np from sklearn.linear_model import LinearRegression X = np.random.random((100, 3)) y = np.random.random(100) model = LinearRegression() 다음으로 이렇게 만들어진 model을 사용해서 X의 라벨을 예측해보겠습니다. model.predict(X) [실행 결과] ------------------------------------------..
이번 포스팅에서는 32개 데이터에 대해 회귀 모델을 적용했을 때의 성능을 바탕으로 어느 상황에서 어떤 모델을 써야하는지에 대한 인사이트를 정리해보겠습니다. 단, 어디까지나 32개 데이터에 대한 실험 결과일 뿐이므로 결과를 맹신하지는 않았으면 좋겠습니다. 사용 데이터 사용한 데이터는 KEEL에서 수집한 32개 회귀 데이터 셋으로 그 정보는 다음과 같습니다. 사용 모델 사용한 회귀 모델은 11개로 sklearn, xgboost, lightgbm의 클래스를 이용해 만들었습니다. from sklearn.ensemble import RandomForestRegressor as RFR from sklearn.ensemble import GradientBoostingRegressor as GBR from sklear..