Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 랜덤포레스트
- 주요 파라미터
- 커리어전환
- 주식데이터
- 퀀트
- 퀀트 투자 책
- 머신러닝
- 이력서 첨삭
- 데이터분석
- 하이퍼 파라미터 튜닝
- 데이터 사이언티스트
- 파라미터 튜닝
- 데이터 사이언스
- AutoML
- 대학원
- 베이지안 최적화
- 사이킷런
- pandas
- 데이터사이언스
- 자기소개서
- 주가데이터
- 파이썬
- 하이퍼 파라미터
- 경력기술서 첨삭
- 판다스
- 경력 기술서
- 데이터사이언스학과
- 코딩테스트
- sklearn
- 데이터사이언티스트
Archives
- Today
- Total
GIL's LAB
문자열 분리하기 본문
이번 포스팅에서는 문자열을 분리하는 방법에 대해 알아보겠습니다.
split 메서드
split 메서드는 입력받은 구분자를 바탕으로 문자열을 리스트로 나눕니다.
예시 코드는 다음과 같습니다.
a = 'line1/line2/line3'
print(a.split('/'))
[실행 결과]
['line1', 'line2', 'line3']
위 예제는 a라는 문자열을 슬래시(/)를 기준으로 나눈 것을 보여줍니다.
re.split 함수
re.split 함수는 문자열을 특정한 패턴을 바탕으로 분리해주는 함수입니다.
이 함수의 입력은 순서대로 패턴과 문자열입니다.
예를 들어, 공백과 줄바꿈 기호를 바탕으로 문자열을 나누는 상황을 생각해보겠습니다.
import re
a = 'line1 line2 line3\nline4'
print(re.split(r"[\s\n]", a))
[실행 결과]
['line1', 'line2', 'line3', 'line4']
위 코드를 보면, a라는 문자열엔 띄어쓰기와 줄바꿈 기호가 혼재되어 있습니다.
이를 [\s\n]이라는 패턴(공백 혹은 줄바꿈이면 일치)을 바탕으로 나눴기에 공백과 줄바꿈 기호 모두 구분자로 인식됐습니다.
이처럼 구분자가 둘 이상인 경우에 쓰기 좋은 함수라고 할 수 있습니다.
데이터 분석 서비스가 필요한 분은 아래 링크로!
'파이썬 > 파이썬 활용 팁' 카테고리의 다른 글
str.findall: 특정 단어가 포함되었는지를 확인 (0) | 2022.12.28 |
---|---|
list comprehension의 효율성 검증 실험 (0) | 2022.11.26 |
파이썬 인스턴스 (AI 모델 포함) 크기 측정 방법 (0) | 2022.01.14 |
모듈에서 파일 불러오기: pkg_resources.resource_filename (0) | 2021.12.16 |
Comments