Python的urllib2的使用
urllib.urlopen(url[, data[, proxies]]) :創建一個表示遠程url的類文件對象,然后像本地文件一樣操作這個類文件對象來獲取遠程數據。
參數url表示遠程數據的路徑,一般是網址;參數data表示以post方式提交到url的數據(玩過web的人應該知道提交數據的兩種方式:post與get。如果你不清楚,也不必太在意,一般情況下很少用到這個參數);參數proxies用于設置代理。
urlopen返回 一個類文件對象,它提供了如下方法:read() , readline() , readlines() , fileno() , close() :這些方法的使用方式與文件對象完全一樣。
info():返回一個httplib.HTTPMessage 對象,表示遠程服務器返回的頭信息。getcode():返回Http狀態碼。如果是http請求,200表示請求成功完成;404表示網址未找到。geturl():返回請求的url。
一、打開一個網頁獲取所有的內容
from urllib import urlopen
doc = urlopen("http://www.baidu.com").read()
print doc
二、獲取Http頭
from urllib import urlopen
doc = urlopen("http://www.baidu.com")
print doc.info()
print doc.info().getheader('Content-Type') #實現圖片下載 import urllib
url = r"http://www.iteye.com/images/logo.gif"
path = r"h:\downloads\1.jpg"
data = urllib.urlopen(url).read()
f = file(path,"wb")
f.write(data)
f.close() 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!