일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 경력기술서 첨삭
- 파라미터 튜닝
- AutoML
- 하이퍼 파라미터
- 판다스
- 머신러닝
- 주요 파라미터
- sklearn
- 대학원
- 파이썬
- 데이터사이언스
- 주식데이터
- 베이지안 최적화
- 데이터사이언티스트
- 퀀트
- 자기소개서
- 하이퍼 파라미터 튜닝
- 경력 기술서
- pandas
- 주가데이터
- 데이터 사이언스
- 이력서 첨삭
- 커리어전환
- 랜덤포레스트
- 데이터사이언스학과
- 데이터분석
- 퀀트 투자 책
- 데이터 사이언티스트
- 코딩테스트
- 사이킷런
- Today
- Total
목록파이썬 (20)
GIL's LAB
이번 포스팅에서는 파이썬을 이용해 프로그램을 개발하는 데 필요한 개발 환경을 구축하고, 이 개발 환경에서 프로그래밍하는 방법을 알아보겠습니다. 여러 개발 환경이 있지만, 스크립트 수준의 코드를 만드는데 적합한 아나콘다 환경에 대해 알아볼 것입니다. 참고로 이 블로그에서 다루는 대부분의 코드는 이 포스팅에서 설명한 주피터 노트북으로 작성한 것입니다. 아나콘다 설치 프로그램 다운로드 아나콘다는 자주 사용되는 패키지와 파이썬 프로그램을 개발하는 데 필요한 환경이 포함된 배포판으로, 패키지 설치 등 추가적인 환경 설정에 관한 부담이 적어 초보자에게 적합합니다. 아나콘다 홈페이지에 접속해 운영체제에 맞는 아나콘다 배포판을 다운로드합니다. 저는 윈도우 운영체제를 사용 중이므로 윈도우용 아나콘다를 다운로드했습니다. ..
이번 포스팅에서는 여러 파라미터 가운데 반응 변수에 가장 큰 영향을 주는 파라미터를 찾는 방법에 대해 알아보겠습니다. 문제 상황 다음과 같이 파라미터 x1, x2, x3가 있고, 파라미터 값에 따른 반응 변수 y가 있다고 하겠습니다. 행 번호 x1 x2 x3 y 1 1 a 5 10 2 1 a 10 10 3 1 b 5 20 4 1 b 10 20 5 2 a 5 25 6 2 a 10 30 7 2 b 5 10 8 2 b 10 15 9 3 a 5 20 10 3 a 10 10 11 3 b 5 30 12 3 b 10 40 x1은 {1, 2, 3}, x2는 {a, b}, x3은 {5, 10}을 순회하면서 설정했고, 그에 따른 y가 있는 것을 알 수 있습니다. 이 데이터에서 궁금한 것은 y에 가장 큰 영향을 끼치는 파라..
개요 이번 실험에서는 낙폭이 심했던 주가는 다시 평균 수준으로 돌아온다는 전략인 평균 회귀 전략을 검증해보겠습니다. 이 그림에서 보듯이, 이 전략은 현 시점을 기준으로 n1 영업일 이전을 과거 시점, n2 영업일 이후를 미래 시점이라 했을 때, n1일 영업일동안 최대 m1(%) 하락한 주가는 n2일 영업일동안 최대 m2(%) 상승할 것이라는 가정에 기반한 전략입니다. 여기서 과거 시점과 미래 시점의 주가를 그대로 사용하는 것이 아니라, 그 기간 내에 최댓값을 사용하는 것에 주목해야 합니다. 다시 말해, 과거에 m1만큼 크게 하락했으면 비슷한 기간 내에 m1과 비슷한 수준으로 다시 오를 것이라 가정하는 것이고 만족할만큼 주가가 회복되면 바로 매도하는 것입니다. 데이터 준비 및 환경 설정 길이가 300이상인..
개요 이번 실험에서는 캔들 패턴을 분석하여 현재 시장에서 매수와 매도 세력 중 어느 세력이 더 강한지를 판단하여 투자하는 전략을 검증해보겠습니다. 굉장히 많은 종류의 캔들 패턴이 있지만, 상승장악형, 하락장악형, 적삼병, 흑삼병, 샛별형이라는 다섯 개의 캔들 패턴을 검증하고, 이번 실험에서는 상승장악형과 하락장악형만 검증해보겠습니다. 구체적으로 각 패턴이 등장했는지 여부를 확인하고, 등장일의 주가와 5, 20, 60, 120 영업일 이후 주가를 비교해보겠습니다. 데이터 준비 이번 실험에는 주가 데이터만 필요합니다. FinanceDataReader를 이용하여 2011년부터 2021년까지의 전 종목의 주가 데이터를 수집했습니다. 주가 데이터를 올리려고 했더니 파일 크기 제한이 있네요. 이제 데이터를 불러옵니..
개요 이번 포스팅에서는 OpenDartReader를 이용하여 코스피/코스닥 기업의 주요 재무지표를 수집하고 가공하겠습니다. 구체적으로 수집 및 가공할 재무지표는 다음과 같습니다. 자산총계 부채총계 자본총계 매출액 영업이익 당기순이익 부채비율 영업이익증가율 매출액증가율 당기순이익 증가율 매출액 상태 영업이익 상태 당기순이익 상태 ROA ROE 관련 패키지 설치와 사용 방법은 이전 포스팅을 참고해주시기 바랍니다. finstate 메서드 finstate 메서드는 기업의 재무 정보를 가져오는데 사용하는 메서드로, 다음과 같이 사용합니다. finstate(corp, bsns_year, reprt_code) corp: 기업명 bsns_year: 사업연도 reprt_code: 보고서 유형 ('11011': 사업보고서..
개요 이번 포스팅에서는 OpenDartReader를 이용하여 코스피/코스닥 기업의 주당 배당금을 수집해보겠습니다. 주당 배당금이 높으면 그 자체로 투자할 가치가 있으며 (물론 배당금에 비해 주가 하락이 심한 경우에는 전혀 그렇지 않습니다), 배당금이 높은 기업일수록 주가 상승률이 높다라는 관계가 있다고 합니다 (역시 자세한 내용은 실험을 통해 검증하겠습니다). 관련 패키지 설치와 사용 방법은 이전 포스팅을 참고해주시기 바랍니다. report 메서드 OpenDartReader의 객체의 report 메서드는 사업보고서의 주요정보를 가져오며, 주요 인자는 다음과 같습니다. dart.report(corp, key_word, bsns_year, reprt_code) 여기서 dart는 임의의 OpenDartRead..
개요 이번 포스팅 시리즈에서는 전자공시 시스템 (DART)에 등록되는 기업공시를 API를 이용하여 수집하는 방법을 소개하고, 모든 기업의 재무제표, 배당정보, 기업정보 등을 수집하겠습니다. 이번 포스팅 (1) 환경 설정에서는 관련 패키지인 OpenDartReader 설치와 인증키를 발급받는 방법에 대해서 알아보겠습니다. 이번 포스팅부터는 책에서 사용하는 논조와 맞추기 위해서, 가능하면 존댓말을 사용하겠습니다. API 인증키 발급 Open DART를 사용하려면 API 인증키를 발급받아야 합니다. 먼저, Open DART 홈페이지 (https://opendart.fss.or.kr/)에 접속합니다. 그러면 아래 그림과 같은 화면이 나오는데, 여기서 박스로 표시한 인증키 신청 버튼을 누릅니다. 인증키 신청을 누..
이번 포스팅에서는 Pandas를 효율적으로 사용하는데 꼭 필요한 함수인 apply 메서드에 대해서 알아보도록 하자. 개요 공식 문서에서는 apply 메서드를 다음과 같이 소개하고 있다. pandas.DataFrame.apply DataFrame.apply(func, axis=0, raw=False, result_type=None, args=(), **kwargs) Apply a function along an axis of the DataFrame. Objects passed to the function are Series objects whose index is either the DataFrame’s index (axis=0) or the DataFrame’s columns (axis=1). By d..
개요 유전 알고리즘은 자연계의 진화 체계를 모방한 메타휴리스틱 알고리즘으로 복잡한 최적화 문제를 푸는데 사용된다. 스케줄링 등 복잡한 최적화 문제를 해결하는데 활용되고 있고, 딥러닝의 초기 웨이트 설정, 특징 선택 등 머신러닝 문제를 해결하는데도 많이 사용된다. 필자의 주력 연구 방법론중 하나이며, 지금도 유전 알고리즘을 이용한 쉐이플릿 탐색이라는 주제로 연구를 진행하고 있다. 그러면 이제 유전 알고리즘이 어떻게 작동하는지, 또 파이썬으로 어떻게 구현할 수 있는지를 소개하자. 가능하면 비전공자의 입장에서 친절히 설명하고자 한다. 최적화 문제란? 최적화 문제는 제약 하에서 목적식을 최소화 혹은 최대화하는 결정 변수의 값을 찾는 문제이다. 제약이란 것은 해가 만족해야 하는 조건이고, 목적식은 최소화 혹은 최..
본 포스팅에서는 종목별로 현금흐름표에서 주요 지표를 뽑아내서 저장하도록 한다. 투자 시 현금흐름표에서 반드시 확인해야 할 사항은 세 가지이다. 영업활동 현금흐름: 기업의 영업활동으로 인한 현금흐름으로 양수여야 함 투자활동 현금흐름: 장비, 기계, 부동산 등을 구입하는 유무형 자산의 취득과 처분에 관련된 현금흐름으로, 정상적인 기업은 이 항목이 음수이지만, 회계상의 이유로 양수가 나오는 경우도 있음 재무활동 현금흐름: 금융 기관으로부터 돈을 빌리거나 갚은 것을 말하며, 음수는 돈을 갚은 것을 의미하고 양수는 돈을 빌린 것을 의미함 본 포스팅에서는 현금흐름표에서 저 세가지 항목을 파이썬을 이용하여 추출하도록 한다. 재무정보 다운로드 가장 먼저, Open Dart에 접속하여, 재무정보를 일괄다운로드하자. 링크..