12306的變態驗證碼算得了什么?我有Python神器!
前言:大家跟我一起念,Python 大Fa好,跟著本寶寶用Python搶火車票!
首先我們需要splinter
安裝:
pip install splinter -i http://pypi.douban.com/simple –trusted-host pypi.douban.com
然后還需要一個瀏覽器的驅動,當然用chrome啦
下載地址:
http://chromedriver.storage.googleapis.com/index.html?path=2.20/
根據下載的自己的電腦系統選擇下載包,我的windows就用win32了
解壓后直接放到C:WindowsSystem32目錄下,你當然也可以給這個驅動程序弄個環境變量。
注意:我下的驅動版本是2.19的,根據自己需要下載相應版本,我的2.20版本有報錯
首先簡單的測試一下吧,推薦ipython代替python自帶的交互界面
from splinter . browser import Browser b = Browser ( driver_name = "chrome" ) b . visit ( "http://www.baidu.com" ) ###注意不要去掉http:// |
然后牛刀小試一下吧,用百度搜索一些東西。比如splinter
在上面我們已經打開百度的網址了
然后我們輸入一些像搜索的內容吧
由上可以發現,該輸入框的name=wd,通過fill似乎只能通過name填充
官方說明: Fill the field identified by name
with the content specified by
value
.
那就在輸入框搜索splinter,當然也可以輸入中文,但是最好指定Unicode編碼,如u”我”
b . fill ( "wd" , "splinter" ) |
有意思的事,你會發現你都不需要點擊“百度一下”就到搜索頁面了
但是,如果多次搜索,我們還是需要點擊“百度一下”的
下面就不在帶著大家找這些元素的id,value什么的了,通過chrome的F12找自己需要的吧
那么把點擊欄find出來吧
我們發現,百度搜索欄的value=”百度一下”,id=”su”
所以把這個按鈕提取出來
button = b . find_by_value ( u "百度一下" ) 或者 button = b . find_by_id ( u "su" ) |
怎么點擊呢?簡單如下 button . click ( ) |
這有什么用?
我們找找頁面里有沒有我想找的東西吧,比如找找有沒有這個地址“splinter.cobrateam.info”
b . is_text_present ( "splinter.cobrateam.info" ) |
如果該頁面存在,則返回True,反之亦然
怎么退出呢?
b . quit ( ) |
好吧,上面就是參照官方文檔寫的一個簡單的入門教程了,下面我們進入正題吧~~~
個人是覺得授人以魚不如授人以漁的,所以我盡量講解所有的內容,而非發個代碼,讓大家copy一下,然后不求甚解。
值得注意的是,我不會去說什么怎么破解驗證碼以及有什么漏洞可以利用什么的,搶過票的都知道,快一點是一點,而我要做的是就能將機器能做的交給機器做,比如點擊,查詢,選擇等,所以希望必中的還是繞過此文吧。筆者水平也就這么一點點。
首先我們用ipython講解一下思路
開始當然是導入啦。。
from splinter . browser import Browser b = Browser ( driver_name = "chrome" ) url = “ https : //kyfw.12306.cn/otn/leftTicket/init” b = Browser ( driver_name = "chrome" ) b . visit ( url ) |
第一步手動登陸,能通過下面的代碼填充表單,但是我跳不過驗證碼,暫時沒有精力去研究那東西,多多見諒,所以還是等手動選擇驗證碼的。
b . find_by_text ( u "登錄" ) . click ( ) b . fill ( "loginUserDTO.user_name" , "xxxx" ) b . fill ( "userDTO.password" , "xxxx" ) |
第二部選擇出發地點日期等
通過cookies選擇出發地點,日期及目的地
首先瞧瞧我們的cookies當然是沒有的出發日期什么的
至于你的出發地點及目的地對于的cookies值是什么,就得靠自己去copy了,我幫不了
怎么有的這些值?
先將地點日期輸進去查詢一下,然后chrome按F12 找到這一部分即可
打開瀏覽器跳到這個頁面當然是沒有我們需要的信息的,比如下面這樣
b . cookies . all ( ) |
{ u 'BIGipServerotn' : u '1977155850.38945.0000' , u 'JSESSIONID' : u '0A01D97598F459F751C4AE8518DBFB300DA7001B67' , u '__NRF' : u '95D48FC2E0E15920BFB61C7A330FF2AE' , u 'current_captcha_type' : u 'Z' } |
然后我們需要添加出發地,這個得自己去查了,是簡單的 url加密 b . cookies . add ( { "_jc_save_fromStation" : "%u4E0A%u6D77%2CSHH" } ) 添加出發日期 b . cookies . add ( { "_jc_save_fromDate" : "2016-01-20" } ) 添加目的地 b . cookies . add ( { u '_jc_save_toStation' : '%u6C38%u5DDE%2CAOQ' } ) 注:如果是修改的話,還是調用 add方法,如果傳入的字典 key值已存在則替換 比如,將目的地改為其他地方 xxxx,如下即可 b . cookies . add ( { u '_jc_save_toStation' : 'xxxxxx' } ) |
然后在看看現在的cookies值
b . cookies . all ( ) |
{ u 'BIGipServerotn' : u '1977155850.38945.0000' , u 'JSESSIONID' : u '0A01D97598F459F751C4AE8518DBFB300DA7001B67' , u '__NRF' : u '95D48FC2E0E15920BFB61C7A330FF2AE' , u '_jc_save_fromDate' : u '2016-01-20' , u '_jc_save_fromStation' : u '%u4E0A%u6D77%2CSHH' , u '_jc_save_toStation' : u '%u6C38%u5DDE%2CAOQ' , u 'current_captcha_type' : u 'Z' } |
既然cookies已經準備完畢,reload一下,開始查詢吧
b . reload ( ) b . find_by_text ( u "查詢" ) . click ( ) |
是不是發現,地點日期都填上了,很酷有木有
到這一步我們得確認的是,自己已經登錄了。一切準備就緒了,就可以刷票了。
值得說明的是,上面的步驟都能手工完成。
下面我們需要用組合BeautifulSoup來判斷預訂可不可以點,當然你也可以選擇單點某一趟
反正我只想買高鐵的,既然這樣,下面兩種方法,一是單點一趟,而是輪循著點很多趟,不放過任何機會。
先說第一個方法吧,這個比較簡單,不需要用到其他庫,單用splinter就夠了,就先從簡單的說起吧。
從我自己坐的火車線路來看,一共六趟,我只想做高鐵,那么我一直點高鐵的那一趟預訂是不是就夠了,當然是!!
一共六個預訂,我的預訂在第二個,索引值自然在1了啦。(會python的不會問我為什么的吧!!!)
b.find_by_text(u”預訂”)[1].click()
然后如果預訂成功
應該跳轉到選擇乘客的位置,
我們就需要按需選擇乘客了
b . find_by_text ( u "你的姓名" ) [ 1 ] . click ( ) |
然后第一種方法基本講解完畢。
上面的步驟摞在一起其實不過100行。
然后應該有第三種方法,就是利用默認的自動查詢,默認是5秒刷新一次,但是大家都知道,春運期間5秒的區間太長了,怎么辦呢?
Chrome的F12一下,點擊Console
輸入autoSearchTime=xxx
默認是毫秒為單位也就是說,默認5000ms,但是不要修改太小,會被偵測到然后報網絡繁忙!!!我改成1000ms似乎只能刷十到十五次就報網絡繁忙了。
其實,用Python刷票也是為了,沒搶到,把刷新頁面定向搶票的進程掛起,我們就不用時時刻刻去刷了,至于源碼,留驅動都在下面的鏈接了~~代 碼還有很多不足,以及寫的不夠優雅,大家可以參考一下,根據實際情況隨便修改~留下的郵箱應該都發完了,一個個發真的發不過來~~