Python的urllib2的使用

jopen 11年前發布 | 12K 次閱讀 Python Python開發

urllib.urlopen(url[, data[, proxies]]) :創建一個表示遠程url的類文件對象,然后像本地文件一樣操作這個類文件對象來獲取遠程數據。

參數url表示遠程數據的路徑,一般是網址;參數data表示以post方式提交到url的數據(玩過web的人應該知道提交數據的兩種方式:post與get。如果你不清楚,也不必太在意,一般情況下很少用到這個參數);參數proxies用于設置代理。

urlopen返回 一個類文件對象,它提供了如下方法:read() , readline() , readlines() , fileno() , close() :這些方法的使用方式與文件對象完全一樣。

info():返回一個httplib.HTTPMessage 對象,表示遠程服務器返回的頭信息。getcode():返回Http狀態碼。如果是http請求,200表示請求成功完成;404表示網址未找到。geturl():返回請求的url。

    一、打開一個網頁獲取所有的內容      

    from urllib import urlopen      
    doc = urlopen("http://www.baidu.com").read()      
    print doc      

    二、獲取Http頭      

    from urllib import urlopen      
    doc = urlopen("http://www.baidu.com")      
    print doc.info()      
    print doc.info().getheader('Content-Type')   
#實現圖片下載
    import urllib       
    url = r"http://www.iteye.com/images/logo.gif"      
    path = r"h:\downloads\1.jpg"      
    data = urllib.urlopen(url).read()       
    f = file(path,"wb")       
    f.write(data)       
    f.close()  

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!