GIL's LAB

str.findall: 특정 단어가 포함되었는지를 확인 본문

파이썬/파이썬 활용 팁

str.findall: 특정 단어가 포함되었는지를 확인

GIL~ 2022. 12. 28. 17:23

본 포스팅에서는 문자열로 구성된 시리즈에 특정 단어 혹은 패턴이 포함되었는지를 확인하는 str.findall 메서드에 대해 알아보겠습니다.

이 메서드에 대한 상세 설명은 아래에서 볼 수 있습니다.

https://pandas.pydata.org/docs/reference/api/pandas.Series.str.findall.html

 

pandas.Series.str.findall — pandas 1.5.2 documentation

next pandas.Series.str.fullmatch

pandas.pydata.org

 

예시 데이터

다음과 같은 간단한 시리즈를 만들어주겠습니다.

import pandas as pd
S = pd.Series(["abc", "abcd", "accb", "bc", "d"])

 

한 단어가 포함됐는지 확인

S에 "c"란 부분 문자열이 몇 개나 포함됐는지는 다음과 같이 구현할 수 있습니다.

S.str.findall("c")

[실행 결과]

0       [c]
1       [c]
2    [c, c]
3       [c]
4        []
dtype: object

실행 결과에서 보듯이, 부분 문자열 c로 구성된 시리즈를 반환합니다.

0번째 요소에는 c가 한개가 있어서 [c]를, 2번째 요소에는 두 개가 있어서 [c, c]를, 4번째 요소에는 없어서 []를 반환합니다.

 

 

여러 단어가 포함됐는지 확인

여러 단어의 포함을 확인하려면 검색하려는 단어를 아래와 같이 |로 연결하면 됩니다.

S.str.findall("a|b|c|d")

[실행 결과]

0       [a, b, c]
1    [a, b, c, d]
2    [a, c, c, b]
3          [b, c]
4             [d]
dtype: object

 


데이터 분석 서비스가 필요한 분은 아래 링크로! 

https://kmong.com/gig/374194 

 

데이터사이언스 박사의 데이터 분석 서비스 드립니다. | 150000원부터 시작 가능한 총 평점 5점의 I

78개 총 작업 개수 완료한 총 평점 5점인 데이터사이언스박사의 IT·프로그래밍, 데이터 분석·시각화 서비스를 68개의 리뷰와 함께 확인해 보세요. IT·프로그래밍, 데이터 분석·시각화 제공 등 150

kmong.com

 

Comments