반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 네이버 로그인 캡챠해결
- pywinauto 윈도우
- UiPath
- Python
- venv 설치
- 파이썬 환경설정
- 네이버 로그인 하기
- Uipath 설치방법
- 파이썬 네이버 로그인
- Uipath 기초
- Selenium 셀렉터잡기
- Element is not clickable at point
- pywinauto 윈도우제어
- 파이썬 가상환경 설치방법
- selenium
- 커머스API
- 가상환경설치
- 네이버부동산크롤링
- pycdc.exe
- uipath 입문
- vscode venv 설치
- 날짜 정규식
- 파이썬 가상환경 설치
- 왕초보 파이썬 실행
- 네이버커머스API
- 네이버 로그인 영수증 해결
- pywinauto
- 파이썬네이버부동산
- pycdas.exe
- 네이버매물크롤링
Archives
- Today
- Total
콘솔워크
간단하게 내용을 스크랩하는 라이브러리 newspaper3k 본문
반응형
https://newspaper.readthedocs.io/en/latest/
라이브러리 설치
# Python 3 이상
pip install newspaper3k
# 그 외의 버전
pip install newspaper
스크랩 한 내용을 메모장에 저장하는 간단한 코드
from newspaper import Article
import os
url = f"https://n.news.naver.com/mnews/article/469/0000716409?sid=105"
article = Article(url, language="ko")
article.download()
article.parse()
article_title = article.title
article_text = article.text
print(f"article_title: {article_title}")
print(f"article_text: {article_text}")
# 해당 내용을 메모장에 저장
if len(article_text) > 0:
try:
# 글 저장 폴더
article_path = os.path.join(os.getcwd(), "article")
if os.path.isdir(article_path) == False:
os.mkdir(article_path)
else:
print(f"{article_path} 이미 폴더가 있습니다.")
article_file = os.path.join(article_path, f"{article_title}.txt")
print(article_file)
f = open(article_file, "w", encoding="UTF8")
f.write(f"{article_text}\n")
f.close()
print(f"{article_title}.txt 파일이 저장되었습니다.")
except Exception as e:
print(f"상점 목록 저장 실패 {str(e)}")
else:
print(f"글이 없습니다.")
정상적으로 작동 한 모습
반응형
'프로그래밍 > python' 카테고리의 다른 글
[정규식] 한글 영어 숫자만 가져오는 정규식 (0) | 2023.01.09 |
---|---|
입력 받은 글을 다시 작성해주는 Smodin Rewriter API (0) | 2023.01.06 |
python 배열 합치기 (+ 연산자) 및 배열에서 요소 제거 (0) | 2023.01.02 |
작업중인 브라우저창을 보이고 싶지 않지만 headless 옵션을 사용할 수 없는 경우 (1) | 2022.12.30 |
dictionary list의 값 바꾸기 (0) | 2022.12.29 |