Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 머신러닝
- 파라미터 튜닝
- 데이터사이언티스트
- 데이터 사이언스
- AutoML
- 경력 기술서
- 데이터사이언스
- 파이썬
- 주식데이터
- 베이지안 최적화
- 데이터 사이언티스트
- 대학원
- pandas
- 퀀트
- 주가데이터
- 데이터분석
- 경력기술서 첨삭
- 하이퍼 파라미터
- 데이터사이언스학과
- 판다스
- 랜덤포레스트
- 퀀트 투자 책
- 이력서 첨삭
- sklearn
- 하이퍼 파라미터 튜닝
- 코딩테스트
- 자기소개서
- 주요 파라미터
- 커리어전환
- 사이킷런
Archives
- Today
- Total
GIL's LAB
str.findall: 특정 단어가 포함되었는지를 확인 본문
본 포스팅에서는 문자열로 구성된 시리즈에 특정 단어 혹은 패턴이 포함되었는지를 확인하는 str.findall 메서드에 대해 알아보겠습니다.
이 메서드에 대한 상세 설명은 아래에서 볼 수 있습니다.
https://pandas.pydata.org/docs/reference/api/pandas.Series.str.findall.html
예시 데이터
다음과 같은 간단한 시리즈를 만들어주겠습니다.
import pandas as pd
S = pd.Series(["abc", "abcd", "accb", "bc", "d"])
한 단어가 포함됐는지 확인
S에 "c"란 부분 문자열이 몇 개나 포함됐는지는 다음과 같이 구현할 수 있습니다.
S.str.findall("c")
[실행 결과]
0 [c]
1 [c]
2 [c, c]
3 [c]
4 []
dtype: object
실행 결과에서 보듯이, 부분 문자열 c로 구성된 시리즈를 반환합니다.
0번째 요소에는 c가 한개가 있어서 [c]를, 2번째 요소에는 두 개가 있어서 [c, c]를, 4번째 요소에는 없어서 []를 반환합니다.
여러 단어가 포함됐는지 확인
여러 단어의 포함을 확인하려면 검색하려는 단어를 아래와 같이 |로 연결하면 됩니다.
S.str.findall("a|b|c|d")
[실행 결과]
0 [a, b, c]
1 [a, b, c, d]
2 [a, c, c, b]
3 [b, c]
4 [d]
dtype: object
데이터 분석 서비스가 필요한 분은 아래 링크로!
'파이썬 > 파이썬 활용 팁' 카테고리의 다른 글
문자열 분리하기 (0) | 2023.08.09 |
---|---|
list comprehension의 효율성 검증 실험 (0) | 2022.11.26 |
파이썬 인스턴스 (AI 모델 포함) 크기 측정 방법 (0) | 2022.01.14 |
모듈에서 파일 불러오기: pkg_resources.resource_filename (0) | 2021.12.16 |
Comments