일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 경력 기술서
- 데이터사이언스학과
- 사이킷런
- 주요 파라미터
- 데이터분석
- 주식데이터
- 파이썬
- 코딩테스트
- pandas
- 대학원
- 퀀트
- 데이터사이언스
- 하이퍼 파라미터 튜닝
- 랜덤포레스트
- AutoML
- 경력기술서 첨삭
- sklearn
- 파라미터 튜닝
- 데이터 사이언스
- 머신러닝
- 데이터사이언티스트
- 데이터 사이언티스트
- 주가데이터
- 판다스
- 베이지안 최적화
- 자기소개서
- 커리어전환
- 하이퍼 파라미터
- 퀀트 투자 책
- 이력서 첨삭
- Today
- Total
목록파이썬/파이썬 활용 팁 (5)
GIL's LAB
이번 포스팅에서는 문자열을 분리하는 방법에 대해 알아보겠습니다. split 메서드 split 메서드는 입력받은 구분자를 바탕으로 문자열을 리스트로 나눕니다. 예시 코드는 다음과 같습니다. a = 'line1/line2/line3' print(a.split('/')) [실행 결과] ['line1', 'line2', 'line3'] 위 예제는 a라는 문자열을 슬래시(/)를 기준으로 나눈 것을 보여줍니다. re.split 함수 re.split 함수는 문자열을 특정한 패턴을 바탕으로 분리해주는 함수입니다. 이 함수의 입력은 순서대로 패턴과 문자열입니다. 예를 들어, 공백과 줄바꿈 기호를 바탕으로 문자열을 나누는 상황을 생각해보겠습니다. import re a = 'line1 line2 line3\nline4' p..
본 포스팅에서는 문자열로 구성된 시리즈에 특정 단어 혹은 패턴이 포함되었는지를 확인하는 str.findall 메서드에 대해 알아보겠습니다. 이 메서드에 대한 상세 설명은 아래에서 볼 수 있습니다. https://pandas.pydata.org/docs/reference/api/pandas.Series.str.findall.html pandas.Series.str.findall — pandas 1.5.2 documentation next pandas.Series.str.fullmatch pandas.pydata.org 예시 데이터 다음과 같은 간단한 시리즈를 만들어주겠습니다. import pandas as pd S = pd.Series(["abc", "abcd", "accb", "bc", "d"]) 한 단..
본 포스팅에서는 파이썬의 list comprehension이 얼마나 효율적인지를 간단한 실험을 통해 알아보겠습니다. 실험은 Jupyter notebook의 %%timeit 매직키워드를 사용하여 실행 시간을 측정해서 비교하는 방식으로 수행하겠습니다. 1. 조건과 함수를 사용하지 않았을 때의 비교 리스트에 속한 모든 요소를 그대로 가져오는 케이스에 대해 실험을 해보겠습니다. 먼저 실험에 사용할 리스트를 다음과 같이 정의해줍니다. L = list(range(100)) 이제 세 가지의 방법으로 L의 요소를 갖는 리스트 L1, L2, L3를 만들어보겠습니다. 방법 1. Append를 사용하는 경우 %%timeit L1 = [] for v in L: L1.append(v) [실행 결과] 9.9 µs ± 678 ns..
파이썬 인스턴스 크기는 sys.getsizeof를 이용하여 측정할 수 있습니다. 크기가 100과 1000000인 난수 배열의 크기를 측정해보겠습니다. 먼저 난수 배열을 다음과 같이 생성합니다. import numpy as np small_arr = np.random.random(100) large_arr = np.random.random(1000000) 다음으로 크기를 측정합니다. print(sys.getsizeof(small_arr)) print(sys.getsizeof(large_arr)) [실행 결과] 896 8000096 크기가 잘 측정되는 것으로 보입니다. 그럼 머신러닝 모델의 인스턴스도 잘 측정되는지 보겠습니다. 먼저 5개의 트리로 구성된 작은 랜덤포레스트 모델과 100개 트리로 구성된 큰 랜..
안녕하세요. 이번 포스팅에서는 파이썬 모듈에서 파일을 불러오는 방법을 알아보겠습니다. 많은 방법을 구글링했지만, 제가 성공한 방법만 소개하겠습니다. 문제 상황 문제는 모듈에서 파일을 불러와서 어떤 처리를 해야하는 상황이었습니다. 즉, 아래와 같은 폴더 구조가 있다고 하겠습니다. My_package --------------------- My_Module.py --------------------- Data_Folder --------------------- Data.txt 여기서 My_Module.py에서 Data_Folder에 있는 Data.txt를 불러오는 것이 목적이었습니다. 첫 시도: 상대 경로 활용 My_Module.py의 상위 경로인 My_package에 접근하면 될 것이라는 단순한 생각으로 ..