python下載百度音樂代碼

fd5f 9年前發布 | 3K 次閱讀 Python

之前看到有人寫過類似的代碼,感覺有點累贅,其中登陸那些東西其實可以避免的

我把百度音樂的網頁代碼稍微分析了一下,如果要求不高,下載普通音質的歌曲是不需要登陸的(當然如果你用瀏覽器打開下載的話,普通音質也是要求登陸下載的)

看其代碼發現,即使你沒有登陸,其實下載鏈接也已經暴露出來了,只是用javascript阻止了你在瀏覽器中下載,

我下面寫了一個下載的demo,順便測試了一下多進程,批量下載很實用:

    #!/usr/bin/env python

#-*- coding: UTF-8 -*-  

import sys,os  
import urllib,urllib2  
from bs4 import BeautifulSoup  
import json  
from multiprocessing import Process  

class BaiDuMusic():  
    def __init__(self):  
        reload(sys)    
        sys.setdefaultencoding('utf8')     

    def search(self,songName):  
        firstUrl = "http://music.baidu.com/search?key="+urllib.quote(str(songName))  
        userAgent = " User-Agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36 "  
        headers = { 'User-Agent' : userAgent }  
        requst = urllib2.Request(firstUrl,headers = headers)   
        result = urllib2.urlopen(requst).read()  

        #使用BeautifulSoup快速解析html文檔  
        soup = BeautifulSoup(result,from_encoding="utf-8")  
        res_arr = []  
        try:  
            tmpjson = soup.find_all("li", { "class" : "bb-dotimg clearfix song-item-hook " })  
            for x in tmpjson:  
                tmpobj = json.loads(x['data-songitem'])  
                value = unicode(tmpobj['songItem']['oid'])+"+++"+unicode(tmpobj['songItem']['author'])+"+++"+unicode(tmpobj['songItem']['sname'])[4:-5]  
                res_arr.append(value)  
            return res_arr  
        except Exception, e:  
            print u"抱歉沒有找到相關資源".encode("utf-8")  
            return 0  
    def download(self,songid,songName,savePath="down/"):  
        songNewUrl = "http://music.baidu.com/data/music/file?link=&song_id="+str(songid)  
        if not os.path.isdir(savePath):   
            os.makedirs(savePath)  
        savemp3 = savePath.decode('utf-8')+songName.decode('utf-8')+u".mp3"  
        urllib.urlretrieve(songNewUrl, savemp3)   

if __name__=='__main__':  

    bMusic = BaiDuMusic()  
    res = bMusic.search(u"冰雨")  
    # for x in res:   
        # print x  
    # 1128053+++劉德華+++冰雨  
    # 7327899+++李翊君+++冰雨  
    # 53535187+++張恒+++冰雨  
    Process(target=bMusic.download, args=(1128053,"劉德華-冰雨")).start()  
    Process(target=bMusic.download, args=(7327899,"李翊君-冰雨")).start()  
    Process(target=bMusic.download, args=(53535187,"張恒-冰雨")).start()  </pre> 


多次測試發現還有一些小問題,比如你搜的歌曲不完整,歌曲:”我可以抱你嗎“,你搜的是“我可以抱你” 那么結果會把“我可以抱你”加上em標簽

上面代碼是沒有去掉的,需要用正則處理一下


轉自:http://blog.csdn.net/jiecooner/article/details/42236065

 本文由用戶 fd5f 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!