Python re.findall()
사용 버전 : Python 3.6.8
사용 프로그램 : Atom 1.36.0 x64
파이썬 re.findall()에 대해서 알아보겠습니다.
괄호 안에는 pattern, string이 들어갑니다.
pattern에는 정규 표현식이, string에는 전체 문자열이 들어갑니다.
re.findall()은 긴 문자열에서 정규 표현식을 이용하여 찾을 때 사용합니다.
정규 표현식은 아래에서 참고하시면 됩니다.
사용할 전체 문자열은 다음 파일입니다.
'^'
시작을 찾는 표현입니다.
'\A'
시작을 찾는 표현입니다.
'$'
끝을 찾는 표현입니다.
'\Z'
끝을 찾는 표현입니다.
'.'
a-z, A-Z, 특수문자, 0-9, 공백들 중에서 하나를 찾는 표현입니다.
'|'
두 가지 중에 하나를 찾는 표현입니다.
단어 단위로 적용됩니다.
설명 추가 |
'[]'
'|' 적용을 여러 개 할 때 사용합니다.
'-'
'[]'와 함께 쓰이며, 순차적인 단어의 범위 지정할 때 사용됩니다.
a-z = a에서 z까지를 나타냅니다.
'[^]'
'[]'에 포함된 문자를 제외한 나머지를 '또는'으로 찾습니다.
'()'
특정 범위를 지정하고 싶을 때 사용합니다.
'?'
없거나, 하나만 있는 것을 찾습니다.
'*'
0부터 무한까지의 개수로 찾습니다.
'+'
1부터 무한까지의 개수로 찾습니다.
'{최소,최대}'
최소 개수부터 최대 개수까지 탐색합니다.
'\'
구분자라고 부르며, 특수한 기능이 있습니다.
'\b'
단어 처음과 끝의 공백 또는 특수문자('_'는 문자로 취급)입니다.
'\B'
첫 번째 문자를 제외한, 문자 사이의 단어를 찾아냅니다.
'\w'
숫자, 영어 그리고 모든 문자를 찾습니다.
'\W'
숫자, 영어 그리고 모든 문자를 제외한 나머지를 찾습니다. (특수문자, 공백 등)
'\s'
공백문자를 찾습니다. ('\n' 등)
'\S'
공백 문자를 제외한 나머지를 찾습니다.
'\d'
모든 숫자를 찾습니다.
'\D'
숫자를 제외한 나머지를 찾습니다.
'\t'
'\t' 문자를 찾습니다.
'\n'
'\n' 문자를 찾습니다.
'{숫자}'
숫자만큼의 문자를 찾습니다.
끝.
카테고리: re, Python
댓글
댓글 쓰기
궁금한 점은 댓글 달아주세요.
Comment if you have any questions.