urllib2下載器網頁的三種方法

jopen 8年前發布 | 7K 次閱讀 Python開發

python網絡爬蟲第一步

#coding:utf8
import urllib2
import cookielib
url = 'http://www.baidu.com'

print("第一種方法")
response1 = urllib2.urlopen(url)
print(response1.getcode())
print(len(response1.read()))

print("第二種方法")
request = urllib2.Request(url)
request.add_header('user-agent','Mozilla/5.0')
response2 = urllib2.urlopen(request)
print(response2.getcode())
print(len(response2.read()))

print("第三種方法")
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
urllib2.install_opener(opener)
response3 = urllib2.urlopen(url)
print(cj)


來自: http://my.oschina.net/passer007/blog/601326

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!