python html에서 원하는 태그만 추출하기

프로그래밍/python

python html에서 원하는 태그만 추출하기

콘솔워크 2023. 5. 31. 23:26

beautifulsoup4 라이브러리를 설치한다.

pip install beautifulsoup4

from bs4 import BeautifulSoup


html_file = r"__test__\article_sample.html"
page = open(html_file, "rt", encoding="utf-8").read()  # HTML 파일 읽고 문자열 리턴
soup = BeautifulSoup(page, "html.parser")  # Soup 객체 생성

# div와 p 두 종류가 있음
for div in soup.find_all(["div", "p"]):
    print(div)

beautifulsoup4 라이브러리를 사용하면 html을 쉽게 파싱할 수 있다.

fild_all 함수를 이용하여 원하는 태그만 추출 가능하다.

저작자표시 비영리 변경금지 (새창열림)

'프로그래밍 > python' 카테고리의 다른 글

파이썬 엑셀 파일 합치는 프로그램 (0)	2023.06.02
python selector xpath 크롬 콘솔에서 테스트방법 (0)	2023.06.01
python 날짜 n월 n주차 구하기 (0)	2023.05.30
selenium이나 request로 크롤링을 하는 중 차단을 당한 경우 우회하는 방법 중 하나 (0)	2023.05.25
python, Enum에 접근할 때, 멤버의 이름을 변수로 받아서 사용하는 방법 (0)	2023.05.22

현재글python html에서 원하는 태그만 추출하기

콘솔워크

파이썬 네이버 로그인, Python, pywinauto, Uipath 기초, 네이버부동산크롤링, 파이썬 환경설정, selenium, venv 설치, 파이썬 가상환경 설치방법, UiPath, 왕초보 파이썬 실행, Element is not clickable at point, 네이버 로그인 하기, Selenium 셀렉터잡기, 파이썬 가상환경 설치, vscode venv 설치, 네이버 로그인 캡챠해결, 네이버 로그인 영수증 해결, 가상환경설치, Uipath 설치방법,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

콘솔워크

python html에서 원하는 태그만 추출하기

'프로그래밍 > python' 카테고리의 다른 글

'프로그래밍/python'의 다른글

티스토리툴바

python html에서 원하는 태그만 추출하기

'프로그래밍 > python' 카테고리의 다른 글

'프로그래밍/python'의 다른글

관련글

티스토리툴바