라벨이 urllib인 게시물 표시

Python urllib.parse.quote()

이미지
사용 버전: Python 3.6.8 사용 프로그램: Atom 1.40.1 x64 ​ 파이썬 urllib.parse.quote()에 대해서 알아보겠습니다. 괄호 안에는 string, safe, encoding, errors 인자가 들어갑니다. ​ urllib.parse.quote()는 아스키코드 형식이 아닌 글자를 URL 인코딩 시켜줍니다. ​ String 인자에는 string, bytes 형식이 들어갑니다. String 형식. Bytes 형식 Safe 인자에는 URL encoding에서 제외할 문자를 넣습니다. 기본으로 '/'이 설정되어 있습니다. Encoding 인자에는 인코딩 이름이 들어갑니다.  string에 들어가는 문자와 맞지 않으면 오류가 나옵니다. 기본적으로 'utf-8'이 들어갑니다. Error 인자에는 'strict', 'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace', 'namereplace', 'surrogateescape', 'surrogatepass'가 들어갑니다. 기본적으로 strict가 설정되어 있습니다. unicode 오류를 알려줍니다. Ignore의 경우 오류는 무시하고, 변환할 수 있는 것만 변환합니다. Replace는 에러 글자를 '?'로 변환해줍니다. 그리고 quote(...

Python urllib.request.urlopen()

이미지
사용 버전 : Python 3.6.7 사용 프로그램 : Atom 1.33.1 x64 ​ 파이썬 urllib.request.open()에 대해서 알아보겠습니다. 괄호 안에는 url, timeout 속성이 들어갑니다. ​ urllib.request.urlopen()은 HTTP 연결을 할 때 사용합니다. HTTP/1.1을 사용하며,  괄호 안에는 url 또는 request object를 사용할 수 있습니다. https://docs.python.org/3/library/urllib.request.html#urllib.request.Request 'url' 속성에는 URL encoding 된 주소가 들어갑니다. 네이버 페이지를 여는 코드를 짜보았습니다. ​ 실행하면, 위와 같이 네이버의 html을 읽어 들입니다. ​ ​ timeout 속성을 사용하면, 연결 대기 시간을 정할 수 있습니다. 서버 측에서 응답이 없거나 늦을 시, 해당 대기시간이 지나면 우리가 연결을 끊습니다. 우리나라는 인터넷 시설이 좋기 때문에, timeout 시간을 0.01초 정도 설정해야 끊기는 걸 볼 수 있습니다. 여기서 주의할 점은 오류 메시지를 띄우면서, 프로그램이 종료된다는 점입니다. 따라서, try, except를 사용하시기 바랍니다. ​ ​ 끝. 카테고리: Python, urllib [계수기] 앱 광고 외국: Hand Counter  ​ https://play.google.com/store/apps/details?id=starlight.jaehwa.handcounter 계수기 앱. 하나씩 개수를 셀 때 사용해보세요. 센 ...

Python urllib.parse.urljoin()

이미지
사용 버전 : Python 3.6.8 사용 프로그램 : Atom 1.35.1 x64 ​ 파이썬 urllib.parse.urljoin()에 대해서 알아보겠습니다. 괄호 안에는 base, url, allow_fragments가 들어갑니다. ​ urllib.parse.urljoin()은 'base_url'과 'url'을 URL 형식으로 합쳐줍니다. 기본 URL(https://www.naver.com)에 more.html을 URL 형식으로 합쳐주었습니다. ​ 만약 'url' 속성에 '//'로 시작하는 글자나, 'http://' 또는 'https://' 형식의 글자가 들어가면, base_url 뒤에 붙는 것이 아니라 base_url의 '//' 부분에 들어갑니다. scheme(http, https)가 붙으면, base_url의 scheme 부분부터 들어갑니다. allow_fragments 속성을 사용하면, url 속성에 '#'을 사용 시, '/'이 붙지 않고, 바로 base_url 뒤에 붙습니다. allow_fragments 속성을 사용하지 않으면, '#'이 붙어도, 그대로 '/'이 붙은 뒤, base_url 뒤에 붙습니다. 끝. 카테고리: Python, urllib

Python urllib.parse.urlparse().scheme

이미지
사용 버전 : Python 3.6.8 사용 프로그램 : Atom 1.35.1 x64 ​ 파이썬 urllib.parse.urlparse().scheme에 대해서 알아보겠습니다. ​ urllib.parse.urlparse().scheme은 해당 URL에서 scheme(통신 프로토콜) 부분만 보여줍니다. 끝. 카테고리: Python, urllib

Python urllib.parse.urlparse()

이미지
사용 버전 : Python 3.6.8 사용 프로그램 : Atom 1.35.1 x64 ​ 파이썬 urllib.parse.urlparse()에 대해서 알아보겠습니다. 괄호 안에는 URL이 들어갑니다. ​ urllib.parse.urlparse()는 입력된 URL을 분석해서 알려줍니다. scheme='https' (통신 프로토콜을 알려줍니다. http 인지, https 인지) netloc='인터넷 주소' (인터넷 주소를 알려줍니다. 예) www.naver.com) path='/경로(...)' (인터넷 주소 뒤에 오는 '/'부터 '파라미터 또는 쿼리문 또는 프레그먼트' 전까지입니다.) params='파라미터' (';'부터 '쿼리문 또는 프레그먼트' 전까지입니다.) query='쿼리문=가나' ('?'부터 '프레그먼트' 전까지입니다.) fragment='프레그먼트' ('#'부터 끝까지입니다.) ​ ​ 실제 예를 보겠습니다. https://docs.python.org/3.6/library/constants.html#None https://search.naver.com/search.naver?sm=top_hty&fbm=0&ie=utf8&query= 끝. 카테고리: Python, urllib