일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 퀀트
- 대학원
- 하이퍼 파라미터
- 데이터분석
- AutoML
- 자기소개서
- 파이썬
- 랜덤포레스트
- 하이퍼 파라미터 튜닝
- 데이터사이언스
- 코딩테스트
- 경력기술서 첨삭
- 베이지안 최적화
- 데이터사이언스학과
- 주요 파라미터
- pandas
- 머신러닝
- 커리어전환
- 경력 기술서
- 주가데이터
- 주식데이터
- sklearn
- 퀀트 투자 책
- 이력서 첨삭
- 데이터사이언티스트
- 데이터 사이언티스트
- 사이킷런
- 데이터 사이언스
- 판다스
- 파라미터 튜닝
- Today
- Total
목록퀀트 투자/데이터 수집 (14)
GIL's LAB
이번 포스팅에서는 국내 주가 데이터를 다운로드할 수 있는 프로그램을 공유하도록 하겠습니다. 프로그램 다운로드는 아래 링크에서 할 수 있으며, 다운로드가 되지 않으면 댓글부탁드립니다. https://drive.google.com/file/d/1Z6w0KpKBCPyUzcnixPU9__x-QlRxRXgM/view?usp=sharing stock_data_collection.exe drive.google.com 매우 간단한 프로그램으로 그 사용 방법을 살펴보겠습니다. 먼저 아래 프로그램을 실행해줍니다. 그러면 아래와 같은 까만 화면이 떴다가 얼마 후에 프로그램이 실행됩니다. 프로그램이 실행된 화면은 아래와 같습니다. 여기서 종목명 옆에 있는 목록 버튼을 누르면 수집 가능한 종목 목록이 다음과 같이 뜹니다. 예를..
이번 포스팅에서는 pandas_datareader를 이용하여 미국 주식 데이터를 수집하는 방법에 대해 알아보겠습니다. 이 패키지는 다양한 금융 데이터를 손쉽게 수집할 수 있도록 하는 패키지입니다. 패키지 설치 pandas-datareader는 pip을 이용해 다음과 같이 설치할 수 있습니다. pip install pandas-datareader 나스닥 종목 불러오기 나스닥 종목은 pandas_datareade.nasdaq_trader의 get_nasdaq_symbols 함수를 이용하여 구할 수 있습니다. from pandas_datareader.nasdaq_trader import get_nasdaq_symbols nasdaq_list = get_nasdaq_symbols() nasdaq_list.hea..
이번 포스팅에서는 이전 포스팅에서 소개한 내용을 확장하여, 전체 주식 데이터를 수집해보겠습니다. 종목 정의 종목은 한국 종목 전체로 하되, 데이터를 모을 수 없는 종목은 제외하겠습니다. # 종목 목록 가져오기 stock_list = fdr.StockListing('KRX') # 선물/옵션 종목 제거 (해당 데이터는 수집 불가) stock_list = stock_list.loc[stock_list['Name'].str[-1] == "콜" & stock_list['Sector'].isnull()] stock_list = stock_list.loc[stock_list['Name'].str[-1] == "풋" & stock_list['Sector'].isnull()] 데이터 수집 특별히 기간을 입력하지 않고 전..
이번 포스팅에서는 OpenDartReader를 이용하여 코스피/코스닥 전체 기업의 주요 재무지표를 수집하겠습니다. 보고서 제출 날짜 뿐만 아니라, 분기별 보고서까지 모두 포함시키겠습니다. OpenDartReader의 설치와 사용 방법은 이전 포스팅을, finstate 메서드에 대한 설명은 이전 포스팅 2를 참고해주시기 바랍니다. 환경 설정 먼저, 필요한 패키지를 모두 불러옵니다. import os import OpenDartReader import FinanceDataReader as fdr 다음으로 종목 목록을 다음과 같이 불러옵니다. stock_list = fdr.StockListing("KRX").dropna() 결측을 제거한 이유는 선물이나 우선주는 지역 등의 정보가 결측이고 이들은 재무제표가 당..
개요 이번 포스팅에서는 OpenDartReader를 이용하여 코스피/코스닥 기업의 주요 재무지표를 수집하고 가공하겠습니다. 구체적으로 수집 및 가공할 재무지표는 다음과 같습니다. 자산총계 부채총계 자본총계 매출액 영업이익 당기순이익 부채비율 영업이익증가율 매출액증가율 당기순이익 증가율 매출액 상태 영업이익 상태 당기순이익 상태 ROA ROE 관련 패키지 설치와 사용 방법은 이전 포스팅을 참고해주시기 바랍니다. finstate 메서드 finstate 메서드는 기업의 재무 정보를 가져오는데 사용하는 메서드로, 다음과 같이 사용합니다. finstate(corp, bsns_year, reprt_code) corp: 기업명 bsns_year: 사업연도 reprt_code: 보고서 유형 ('11011': 사업보고서..
개요 이번 포스팅에서는 OpenDartReader를 이용하여 코스피/코스닥 기업의 주당 배당금을 수집해보겠습니다. 주당 배당금이 높으면 그 자체로 투자할 가치가 있으며 (물론 배당금에 비해 주가 하락이 심한 경우에는 전혀 그렇지 않습니다), 배당금이 높은 기업일수록 주가 상승률이 높다라는 관계가 있다고 합니다 (역시 자세한 내용은 실험을 통해 검증하겠습니다). 관련 패키지 설치와 사용 방법은 이전 포스팅을 참고해주시기 바랍니다. report 메서드 OpenDartReader의 객체의 report 메서드는 사업보고서의 주요정보를 가져오며, 주요 인자는 다음과 같습니다. dart.report(corp, key_word, bsns_year, reprt_code) 여기서 dart는 임의의 OpenDartRead..
개요 이번 포스팅 시리즈에서는 전자공시 시스템 (DART)에 등록되는 기업공시를 API를 이용하여 수집하는 방법을 소개하고, 모든 기업의 재무제표, 배당정보, 기업정보 등을 수집하겠습니다. 이번 포스팅 (1) 환경 설정에서는 관련 패키지인 OpenDartReader 설치와 인증키를 발급받는 방법에 대해서 알아보겠습니다. 이번 포스팅부터는 책에서 사용하는 논조와 맞추기 위해서, 가능하면 존댓말을 사용하겠습니다. API 인증키 발급 Open DART를 사용하려면 API 인증키를 발급받아야 합니다. 먼저, Open DART 홈페이지 (https://opendart.fss.or.kr/)에 접속합니다. 그러면 아래 그림과 같은 화면이 나오는데, 여기서 박스로 표시한 인증키 신청 버튼을 누릅니다. 인증키 신청을 누..
이번 포스팅에서는 이전 포스팅에서 소개한 Cybos Plus를 가지고 분틱 코스피/코스닥 데이터를 수집하는 방법을 소개한다. 이 방법을 바탕으로 수집한 데이터는 다양한 퀀트 실험에 활용할 예정이다 (일별 데이터 수집 내용과 거의 중복되지만, 이전 포스팅을 보고 이해하고 이 포스팅을 보긴 힘들 것 같아서 복붙을 했다). 가장 먼저, Cybos Plus를 실행해서 로그인한다. 그리고나서 주피터를 32bit 환경에서 관리자권한으로 실행한다. 즉, 아나콘다 프롬프트를 관리자권한으로 실행한 뒤, 아래 명령어를 순차적으로 입력하여 주피터를 실행한다. set CONDA_FORCE_32BIT=1 conda activate py36_32 jupyter notebook 당연하지만, 이전 포스팅에서 py36_32 환경을 구..
본 포스팅에서는 종목별로 현금흐름표에서 주요 지표를 뽑아내서 저장하도록 한다. 투자 시 현금흐름표에서 반드시 확인해야 할 사항은 세 가지이다. 영업활동 현금흐름: 기업의 영업활동으로 인한 현금흐름으로 양수여야 함 투자활동 현금흐름: 장비, 기계, 부동산 등을 구입하는 유무형 자산의 취득과 처분에 관련된 현금흐름으로, 정상적인 기업은 이 항목이 음수이지만, 회계상의 이유로 양수가 나오는 경우도 있음 재무활동 현금흐름: 금융 기관으로부터 돈을 빌리거나 갚은 것을 말하며, 음수는 돈을 갚은 것을 의미하고 양수는 돈을 빌린 것을 의미함 본 포스팅에서는 현금흐름표에서 저 세가지 항목을 파이썬을 이용하여 추출하도록 한다. 재무정보 다운로드 가장 먼저, Open Dart에 접속하여, 재무정보를 일괄다운로드하자. 링크..
본 포스팅에서는 투자시에 자주 참고하게 되는 EPS, PER, 영업이익률 등의 투자지표를 크롤링하는 방법을 소개한다. 먼저, 아이투자(http://www.itooza.com/)에 접속하자. 접속하면 아래와 같은 화면을 볼 수 있다. 빨간 박스로 표시한 검색창에 관심있는 종목명 혹은 종목코드를 검색해보도록 하자. 여기서는 예제로 SK하이닉스를 검색하였다. 검색하면 아래와 같은 화면을 볼 수 있다. 보다시피, SK하이닉스의 다양한 투자지표가 테이블 형태로 정리된 것을 볼 수 있다. 본 포스팅에서는 저 테이블을 크롤링할 것이다. 다만, 투자지표가 컬럼명으로 오는 것이 추후 분석에 편할 것 같아 전치를 시켜서 저장하도록 한다. 자, 그러면 이제 파이썬으로 저 테이블을 크롤링해보자. 먼저 필요한 모듈을 다음과 같..