파이썬/파이썬 활용 팁
str.findall: 특정 단어가 포함되었는지를 확인
GIL~
2022. 12. 28. 17:23
본 포스팅에서는 문자열로 구성된 시리즈에 특정 단어 혹은 패턴이 포함되었는지를 확인하는 str.findall 메서드에 대해 알아보겠습니다.
이 메서드에 대한 상세 설명은 아래에서 볼 수 있습니다.
https://pandas.pydata.org/docs/reference/api/pandas.Series.str.findall.html
pandas.Series.str.findall — pandas 1.5.2 documentation
next pandas.Series.str.fullmatch
pandas.pydata.org
예시 데이터
다음과 같은 간단한 시리즈를 만들어주겠습니다.
import pandas as pd
S = pd.Series(["abc", "abcd", "accb", "bc", "d"])
한 단어가 포함됐는지 확인
S에 "c"란 부분 문자열이 몇 개나 포함됐는지는 다음과 같이 구현할 수 있습니다.
S.str.findall("c")
[실행 결과]
0 [c]
1 [c]
2 [c, c]
3 [c]
4 []
dtype: object
실행 결과에서 보듯이, 부분 문자열 c로 구성된 시리즈를 반환합니다.
0번째 요소에는 c가 한개가 있어서 [c]를, 2번째 요소에는 두 개가 있어서 [c, c]를, 4번째 요소에는 없어서 []를 반환합니다.
여러 단어가 포함됐는지 확인
여러 단어의 포함을 확인하려면 검색하려는 단어를 아래와 같이 |로 연결하면 됩니다.
S.str.findall("a|b|c|d")
[실행 결과]
0 [a, b, c]
1 [a, b, c, d]
2 [a, c, c, b]
3 [b, c]
4 [d]
dtype: object
데이터 분석 서비스가 필요한 분은 아래 링크로!
데이터사이언스 박사의 데이터 분석 서비스 드립니다. | 150000원부터 시작 가능한 총 평점 5점의 I
78개 총 작업 개수 완료한 총 평점 5점인 데이터사이언스박사의 IT·프로그래밍, 데이터 분석·시각화 서비스를 68개의 리뷰와 함께 확인해 보세요. IT·프로그래밍, 데이터 분석·시각화 제공 등 150
kmong.com