프로그래밍/python
[selenium] 크롤링으로 가져온 문자열이 깨져있는 경우
이휘재123
2022. 6. 21. 16:33
반응형
가끔 selenium으로 url을 긁어오는데 한글로 되어있는 부분이 특수문자로 바뀌어있는 경우가 있다.
ex) https://www.asdfasdfasdf%#$#$@#@#!#@$#$
이는 urllib 패키지의 urllib.parse.unquote 모듈을 사용하면 정상적인 문자열로 출력할 수 있다.
import urllib
url = 'https://www.asdfasdfasdf%#$#$@#@#!#@$#$'
def encode_url(url):
encode_url = urllib.parse.unquote(url)
print(encode_url)
return encode_url
반응형