GIL's LAB

Notice

Recent Posts

Recent Comments

Link

« 2025/12 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록전체 글 (127)

GIL's LAB

주가 데이터 다운로더 프로그램

이번 포스팅에서는 국내 주가 데이터를 다운로드할 수 있는 프로그램을 공유하도록 하겠습니다. 프로그램 다운로드는 아래 링크에서 할 수 있으며, 다운로드가 되지 않으면 댓글부탁드립니다. https://drive.google.com/file/d/1Z6w0KpKBCPyUzcnixPU9__x-QlRxRXgM/view?usp=sharing stock_data_collection.exe drive.google.com 매우 간단한 프로그램으로 그 사용 방법을 살펴보겠습니다. 먼저 아래 프로그램을 실행해줍니다. 그러면 아래와 같은 까만 화면이 떴다가 얼마 후에 프로그램이 실행됩니다. 프로그램이 실행된 화면은 아래와 같습니다. 여기서 종목명 옆에 있는 목록 버튼을 누르면 수집 가능한 종목 목록이 다음과 같이 뜹니다. 예를..

퀀트 투자/데이터 수집 2023. 8. 13. 10:04

모바일로 티스토리 블로그 수익 보는 방법

티스토리 어플로는 블로그 수익을 확인할 수 없고, 또 모바일 웹으로 들어가면 자연스럽게 모바일 어플 화면처럼 나옵니다. 이것저것 구글링해봤지만 휴대폰 종류나 티스토리 버전 등에 따라 안되는게 너무 많았는데, 간단한 해결책을 찾았습니다. 해결책은 모바일 웹에서 주소/manage로 접속하는 것입니다. 가령, 제 블로그의 경우에는 아래 주소로 접속할 수 있습니다. https://gils-lab.tistory.com/manage/ Tistory 좀 아는 블로거들의 유용한 이야기 www.tistory.com 여기에 접속하면 웹에서 보는 관리자 화면이 나옵니다. 물론 로그인을 해야 보입니다!

기타 주절주절 2023. 8. 10. 10:25

문자열 분리하기

이번 포스팅에서는 문자열을 분리하는 방법에 대해 알아보겠습니다. split 메서드 split 메서드는 입력받은 구분자를 바탕으로 문자열을 리스트로 나눕니다. 예시 코드는 다음과 같습니다. a = 'line1/line2/line3' print(a.split('/')) [실행 결과] ['line1', 'line2', 'line3'] 위 예제는 a라는 문자열을 슬래시(/)를 기준으로 나눈 것을 보여줍니다. re.split 함수 re.split 함수는 문자열을 특정한 패턴을 바탕으로 분리해주는 함수입니다. 이 함수의 입력은 순서대로 패턴과 문자열입니다. 예를 들어, 공백과 줄바꿈 기호를 바탕으로 문자열을 나누는 상황을 생각해보겠습니다. import re a = 'line1 line2 line3\nline4' p..

파이썬/파이썬 활용 팁 2023. 8. 9. 09:00

영어 감성 사전

이번 포스팅에서는 자주 사용되는 감성 사전을 간단히 알아보고, 이 파일을 공유하겠습니다. 참고로 R에서는 textdata 라이브러리에 내장되어 있으나, 저 같은 파이썬 유저에게는 직접 다운로드받는게 편합니다. AFINN 각 단어를 -5점과 5점 사이의 점수로 평가한 사전으로 5에 가까울수록 긍정, -5에 가까울수록 부정을 나타냅니다. BING 각 단어를 긍정(positive)와 부정(negative)로 분류한 사전입니다. NRC 각 단어를 긍정과 부정 외에도 다양한 감정으로 분류한 사전입니다. 데이터 분석 서비스가 필요한 분은 아래 링크로! https://kmong.com/gig/374194 데이터사이언스 박사의 데이터 분석 서비스 드립니다. | 150000원부터 시작 가능한 총 평점 5점의 I 78개 ..

데이터사이언스/머신러닝 2023. 8. 8. 15:12

Scikit-learn NotFittedError

NotFittedError는 사이킷런의 모델 인스턴스를 학습하지 않고 활용할 때 발생하는 에러입니다. 간단한 예시를 살펴보겠습니다. 먼저 임의로 데이터를 만들고 LinearRegression 클래스를 이용해서 선형 회귀 모델을 만들겠습니다. import numpy as np from sklearn.linear_model import LinearRegression X = np.random.random((100, 3)) y = np.random.random(100) model = LinearRegression() 다음으로 이렇게 만들어진 model을 사용해서 X의 라벨을 예측해보겠습니다. model.predict(X) [실행 결과] ------------------------------------------..

파이썬/환경설정 및 오류 해결 2023. 8. 7. 10:29

ValueError: too many values to unpack, ValueError: not enough values to unpack 해결 방법

문제 상황 ValueError: too many values to unpack는 저장할 값의 개수가 변수 개수보다 많은 경우 발생하는 에러입니다. 간단한 예제를 살펴보겠습니다. x, y, z = 1, 2, 3, 4 [실행 결과] ValueError: too many values to unpack (expected 3) 위 코드에서 변수는 x, y, z로 세 개인데, 여기에 입력되는 값이 1, 2, 3, 4라서 오류가 발생했습니다. 반대로 ValueError: not enough values to unpack는 저장할 값의 개수가 변수 개수보다 적은 경우 발생하는 에러입니다. 역시 간단한 예제를 살펴보겠습니다. x, y, z = 1, 2 [실행 결과] ValueError: not enough values ..

파이썬/환경설정 및 오류 해결 2023. 8. 7. 09:50

대학원 입학 자기소개서 작성시 고려할 사항

이번 포스팅에서는 대학원 입학 자기소개서 작성시에 많은 분들이 놓치는 사항에 대해 간단히 알아보겠습니다. 여기서는 이공계 일반 대학원에 석사 과정으로 지원하고자 하는 분에게 한정했으며, 문과 혹은 박사 과정에게는 유효하지 않을 수 있습니다. 대학원은 뭘 하는 곳인가? 대학원은 연구를 하는 곳입니다. 간혹 무엇을 더 배우기 위해 대학원에 가겠다라는 분들이 있는데, 대학원에서는 특별한 무언가를 가르쳐주지 않습니다. 학부 과정에서는 여러 수업을 듣고 좋은 학점을 받는 것이 지상 목표였겠지만, 석사 과정부터는 수업을 들어서 무엇을 배운다기보다 자신의 연구에 필요한 것을 스스로 찾아서 공부하는게 중요합니다. 물론 대학원도 수업이 개설되지만 학부때에 비해 크게 신경쓰지 않습니다. 따라서 무엇을 더 배우기 위해 진학..

데이터사이언스/커리어 2023. 8. 4. 08:42

로또 추천이 말도 안되는 이유 (feat data)

굉장히 오랜만에 포스팅을 올립니다. 요즘에는 줄긴 했으나, 여전히 로또를 추천해준다는 서비스가 있습니다. 애초에 정말 로또 번호를 높은 확률로 예측할 수 있으면 서비스를 만들지말고 로또를 사는게 당연히 합리적인 선택이니, 당연히 신빙성없는 서비스입니다. 그럼 데이터를 보면서 로또 번호 예측이 왜 불가능한지를 알아보겠습니다. 데이터 현재까지의 로또 당첨 번호 데이터는 동행복권 공식 홈페이지에서 다운로드받을 수 있습니다. https://dhlottery.co.kr/gameResult.do?method=byWin&wiselog=H_C_1_1 로또6/45 - 회차별 당첨번호 1078회 당첨결과 (2023년 07월 29일 추첨) 당첨번호 6 10 11 14 36 38 1078회 순위별 등위별 총 당첨금액, 당첨게..

데이터사이언스/확률 통계 2023. 8. 1. 15:36

변수 구간화(범주화)

오랜만에 포스팅입니다. 본 포스팅에서는 변수를 구간화하는 방법에 대해 알아보겠습니다. 변수 구간화란? 변수 구간화는 연속형 변수를 정해진 구간에 따라 구간화하여 서열형 변수로 변환하는 작업이라 할 수 있습니다. 간단한 예시를 살펴보겠습니다. 위 예시에서는 신장(cm)이란 변수를 세 개의 구간으로 구간화했습니다. 즉, 신장이 180cm이던 A란 사람은 [180, 190)의 구간에 속하므로 신장이 3으로 변했고, 신장이 175인 D란 사람은 [170, 180)이란 구간에 속하므로 2로 변했습니다. 구간화의 효과 그럼 왜 구간화를 하는지에 대해 생각해보겠습니다. 어떤 전처리 기법 혹은 모델링 기법을 사용할 때, 이게 왜 필요한지, 그리고 장/단점은 무엇인지 생각해야 합니다. 구간화를 한다는 것은 연속형 변수를..

데이터사이언스/머신러닝 2023. 3. 6. 11:04

str.findall: 특정 단어가 포함되었는지를 확인

본 포스팅에서는 문자열로 구성된 시리즈에 특정 단어 혹은 패턴이 포함되었는지를 확인하는 str.findall 메서드에 대해 알아보겠습니다. 이 메서드에 대한 상세 설명은 아래에서 볼 수 있습니다. https://pandas.pydata.org/docs/reference/api/pandas.Series.str.findall.html pandas.Series.str.findall — pandas 1.5.2 documentation next pandas.Series.str.fullmatch pandas.pydata.org 예시 데이터 다음과 같은 간단한 시리즈를 만들어주겠습니다. import pandas as pd S = pd.Series(["abc", "abcd", "accb", "bc", "d"]) 한 단..

파이썬/파이썬 활용 팁 2022. 12. 28. 17:23

이전 Prev 1 2 3 4 5 ··· 13 Next 다음

목록전체 글 (127)

GIL's LAB

티스토리툴바