Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 데이터 사이언스
- 주가데이터
- AutoML
- 커리어전환
- pandas
- 베이지안 최적화
- 퀀트 투자 책
- 코딩테스트
- 데이터사이언티스트
- 퀀트
- 주식데이터
- 하이퍼 파라미터 튜닝
- 판다스
- 랜덤포레스트
- 사이킷런
- 하이퍼 파라미터
- 경력기술서 첨삭
- 파라미터 튜닝
- sklearn
- 데이터사이언스
- 데이터사이언스학과
- 자기소개서
- 경력 기술서
- 머신러닝
- 데이터 사이언티스트
- 파이썬
- 이력서 첨삭
- 데이터분석
- 대학원
- 주요 파라미터
Archives
- Today
- Total
GIL's LAB
pandas_datareader를 이용한 미국 주식(나스닥) 데이터 수집 본문
이번 포스팅에서는 pandas_datareader를 이용하여 미국 주식 데이터를 수집하는 방법에 대해 알아보겠습니다.
이 패키지는 다양한 금융 데이터를 손쉽게 수집할 수 있도록 하는 패키지입니다.
패키지 설치
pandas-datareader는 pip을 이용해 다음과 같이 설치할 수 있습니다.
pip install pandas-datareader
나스닥 종목 불러오기
나스닥 종목은 pandas_datareade.nasdaq_trader의 get_nasdaq_symbols 함수를 이용하여 구할 수 있습니다.
from pandas_datareader.nasdaq_trader import get_nasdaq_symbols
nasdaq_list = get_nasdaq_symbols()
nasdaq_list.head()
[실행 결과]
실행 결과에서 각 컬럼의 정보는 다음과 같습니다 (출처: https://www.nasdaqtrader.com/trader.aspx?id=symboldirdefs)
Symbol | The one to four or five character identifier for each NASDAQ-listed security. |
Security Name | Company issuing the security. |
Market Category | The category assigned to the issue by NASDAQ based on Listing Requirements. Values:
|
Test Issue | Indicates whether or not the security is a test security. Values: Y = yes, it is a test issue. N = no, it is not a test issue. |
Financial Status | Indicates when an issuer has failed to submit its regulatory filings on a timely basis, has failed to meet NASDAQ's continuing listing standards, and/or has filed for bankruptcy. Values include:
|
Round Lot | Indicates the number of shares that make up a round lot for the given security. |
File Creation Time: | The last row of each Symbol Directory text file contains a timestamp that reports the File Creation Time. The file creation time is based on when NASDAQ Trader generates the file and can be used to determine the timeliness of the associated data. The row contains the words File Creation Time followed by mmddyyyyhhmm as the first field, followed by all delimiters to round out the row. An example: File Creation Time: 1217200717:03||||| |
예를 들어, Market Category가 Q이면서 Financial Status가 N인 종목만 가져오겠습니다.
f_nasdaq_list = nasdaq_list.loc[(nasdaq_list['Market Category'] == "Q") & (nasdaq_list['Financial Status'] == "N")]
f_nasdaq_list.head()
[실행 결과]
나스닥 종목 불러오기
이제 본격적으로 데이터를 불러오겠습니다.
먼저 필요한 두 모듈을 불러옵니다.
import pandas as pd
import pandas_datareader.data as reader
다음으로 데이터를 수집할 기간을 YYYYMMDD 형식으로 다음과 같이 설정합니다.
start_date = "20210101"
end_date = "20211231"
이제 DataReader 함수를 이용하여 데이터를 불러오겠습니다.
이 함수는 심볼, 데이터 수집 소스, 시작 날짜, 종료 날짜를 입력으로 받습니다.
야후 파이낸셜에서 애플(심볼: AAPL)의 주가를 수집해보겠습니다.
df = reader.DataReader('AAPL', 'yahoo', start=start_date, end=end_date)
df.head()
[실행 결과]
굳이 로컬에 저장하지 않아도 될 정도로, 너무나 쉽게 데이터를 수집할 수 있음을 알 수 있습니다.
데이터 분석 서비스가 필요한 분은 아래 링크로!
'퀀트 투자 > 데이터 수집' 카테고리의 다른 글
주가 데이터 다운로더 프로그램 (35) | 2023.08.13 |
---|---|
FinanceDataReader를 이용한 전체 주식 데이터 수집 (0) | 2021.12.16 |
Open DART를 이용한 기업공시 수집 (4) 전체 재무제표 수집 (5) | 2021.12.15 |
Open DART를 이용한 기업공시 수집 (3) 주요 재무지표 수집 및 가공 (12) | 2021.10.12 |
Open DART를 이용한 기업공시 수집 (2) 주당 배당금 수집 (14) | 2021.10.11 |
Comments