My Drive

pythonchallenge #04 - html 본문

writeup

pythonchallenge #04 - html

sunnyeo.park 2014. 12. 1. 01:41

# 네 번째 문제

아무런 설명 없이 그림만 딸랑 있다.



그림에 링크가 걸려있어 클릭해보니 아래와 같은 창이 뜬다.

url을 보니 뒤에 nothing=12345라는게 붙어있고, 다음 nothing는 44827이라고 한다.



다시 전 페이지로 돌아와 소스를 보니 힌트가 주어져 있다.

urllib를 사용하고, 400번 안에는 끝날거라고 한다. 아마 저 숫자를 몇 백 페이지 동안 넘겨야 하는 듯 싶다.



그렇다면 

http://www.pythonchallenge.com/pc/def/linkedlist.php?nothing=12345 페이지에 접속해 내용을 읽은 후

숫자를 얻어와서

nothing를 바꾼 페이지에 다시 접속, 이를 반복해면 될 듯 하다.


위와 같이 하다 보니 중간에 아래와 같은 페이지가 떠서 처리를 해주었다.



※ html 처리하기 - urllib 사용

* GET 방식 요청 예제

>>> import urllib
>>> params = urllib.urlencode({'spam': 1, 'eggs': 2, 'bacon': 0})
>>> f = urllib.urlopen("http://www.musi-cal.com/cgi-bin/query?%s" % params)
>>> print f.read()

* POST 방식 요청 예제

>>> import urllib
>>> params = urllib.urlencode({'spam': 1, 'eggs': 2, 'bacon': 0})
>>> f = urllib.urlopen("http://www.musi-cal.com/cgi-bin/query", params)
>>> print f.read()


urllib.urlopen(url[, data[, proxies[, context]]])

- read(), readline(), readlines(), fileno(), close()  함수 지원 (File I/O랑 동일한 인터페이스)

- info(), getcode(), geturl()  함수 지원

info() : header 리턴

getcode() : http 상태 코드 리턴 (OK : 200)

geturl() : url 리턴

urllib.quote(string[, safe]) Example: quote('/~connolly/') yields '/%7econnolly/'.

urllib.unquote(string) Example: unquote('/%7Econnolly/') yields '/~connolly/'.




'writeup' 카테고리의 다른 글

pythonchallenge #06 - zipfile  (0) 2014.12.03
pythonchallenge #05 - pickle  (0) 2014.12.02
pythonchallenge #03  (0) 2014.11.30
pythonchallenge #02 - 파일 입출력  (0) 2014.11.28
pythonchallenge #01 - string 함수  (0) 2014.11.28
Comments