콘솔워크

html 태그를 제외한 문자열을 추출하는 정규식 본문

프로그래밍/python

html 태그를 제외한 문자열을 추출하는 정규식

이휘재123 2023. 4. 11. 17:49
반응형
import re

html_text = "<p>안녕하세요. <strong>파이썬</strong>입니다.</p>"
text = re.sub('<[^<]+?>', '', html_text)  # 태그를 빈 문자열로 대체
print(text)  # "안녕하세요. 파이썬입니다."

 

반응형