콘솔워크

[selenium] 크롤링으로 가져온 문자열이 깨져있는 경우 본문

프로그래밍/python

[selenium] 크롤링으로 가져온 문자열이 깨져있는 경우

이휘재123 2022. 6. 21. 16:33
반응형

가끔 selenium으로 url을 긁어오는데 한글로 되어있는 부분이 특수문자로 바뀌어있는 경우가 있다.

ex) https://www.asdfasdfasdf%#$#$@#@#!#@$#$

이는 urllib 패키지의 urllib.parse.unquote 모듈을 사용하면 정상적인 문자열로 출력할 수 있다.

 

import urllib
   
url = 'https://www.asdfasdfasdf%#$#$@#@#!#@$#$'
   
def encode_url(url):
     encode_url = urllib.parse.unquote(url)
     print(encode_url)
     return encode_url

 

반응형