728x90
re.sub
re 모듈에 있는 sub() 함수는 문자열 조작에 사용할 수 있다.
re.sub(정규표현식, 치환문자, 대상 문자열)
text = "hello HELLO, my name is minjee. I woke up early today."
이런 문자열이 있고 여기서 ',' 와 '.' 를 제거해야하는 경우
text_mod = re.sub(r'[^\w]', ' ', text)
hello HELLO my name is minjee I woke up early today
이렇게 바꿀 수 있다.
정규표현식에서 ^ 는 not 을 의미하고 \w는 문자열를 의미한다.
즉 위의 코드는 문자에 해당하지 않는 것들을 공백열로 바꿔주고 있다.
그렇다면 파이썬 정규표현식은 무엇일까 ?
파이썬에서 문자열의 일정한 패턴을 표현하는 일종의 형식언어이다. 특정 패턴으로 문자열을 검색하거나 오류를 선별해낼때 주로 사용한다.
정규표현식 예시
\d : [0-9]
\D : [^0-9]
\w : [a-zA-Z0-9_]
\W : [^a-zA-Z0-9]
728x90
'Programming Languages > Python' 카테고리의 다른 글
[Python] ATM 프로그램/은행 프로그램 파이썬으로 만들기 (파일 입출력으로 데이터 저장) (0) | 2022.11.10 |
---|---|
Python k 진수로 바꾸기 (0) | 2022.09.30 |
[Python] defaultdict 문법 정리 (0) | 2022.09.11 |
Python 다익스트라 최단경로 알고리즘 (0) | 2022.01.31 |
python bisect, bisect_left, bisect_right (0) | 2022.01.25 |