12306的變態驗證碼算得了什么?我有Python神器!

jopen 8年前發布 | 13K 次閱讀 驗證碼

 

前言:大家跟我一起念,Python 大Fa好,跟著本寶寶用Python搶火車票!

首先我們需要splinter

安裝:

pip install splinter -i http://pypi.douban.com/simple –trusted-host pypi.douban.com

然后還需要一個瀏覽器的驅動,當然用chrome啦

下載地址:

http://chromedriver.storage.googleapis.com/index.html?path=2.20/

根據下載的自己的電腦系統選擇下載包,我的windows就用win32了

解壓后直接放到C:WindowsSystem32目錄下,你當然也可以給這個驅動程序弄個環境變量。

注意:我下的驅動版本是2.19的,根據自己需要下載相應版本,我的2.20版本有報錯

首先簡單的測試一下吧,推薦ipython代替python自帶的交互界面

from splinter . browser import Browser

b = Browser ( driver_name = "chrome" )

b . visit ( "http://www.baidu.com" )    ###注意不要去掉http://

然后牛刀小試一下吧,用百度搜索一些東西。比如splinter

在上面我們已經打開百度的網址了

然后我們輸入一些像搜索的內容吧

12306的變態驗證碼算得了什么?我有Python神器!

由上可以發現,該輸入框的name=wd,通過fill似乎只能通過name填充

官方說明: Fill the field identified by name with the content specified by  value .

那就在輸入框搜索splinter,當然也可以輸入中文,但是最好指定Unicode編碼,如u”我”

b . fill ( "wd" , "splinter" )

有意思的事,你會發現你都不需要點擊“百度一下”就到搜索頁面了

但是,如果多次搜索,我們還是需要點擊“百度一下”的

下面就不在帶著大家找這些元素的id,value什么的了,通過chrome的F12找自己需要的吧

那么把點擊欄find出來吧

我們發現,百度搜索欄的value=”百度一下”,id=”su”

所以把這個按鈕提取出來

button  b . find_by_value ( u "百度一下" )

或者

button  b . find_by_id ( u "su" )

怎么點擊呢?簡單如下

button . click ( )

這有什么用?

我們找找頁面里有沒有我想找的東西吧,比如找找有沒有這個地址“splinter.cobrateam.info”

b . is_text_present ( "splinter.cobrateam.info" )

如果該頁面存在,則返回True,反之亦然

怎么退出呢?

b . quit ( )

好吧,上面就是參照官方文檔寫的一個簡單的入門教程了,下面我們進入正題吧~~~

個人是覺得授人以魚不如授人以漁的,所以我盡量講解所有的內容,而非發個代碼,讓大家copy一下,然后不求甚解。

值得注意的是,我不會去說什么怎么破解驗證碼以及有什么漏洞可以利用什么的,搶過票的都知道,快一點是一點,而我要做的是就能將機器能做的交給機器做,比如點擊,查詢,選擇等,所以希望必中的還是繞過此文吧。筆者水平也就這么一點點。

首先我們用ipython講解一下思路

開始當然是導入啦。。

from  splinter . browser  import  Browser

Browser ( driver_name = "chrome" )

url  = “ https : //kyfw.12306.cn/otn/leftTicket/init”

Browser ( driver_name = "chrome" )

b . visit ( url )

第一步手動登陸,能通過下面的代碼填充表單,但是我跳不過驗證碼,暫時沒有精力去研究那東西,多多見諒,所以還是等手動選擇驗證碼的。

b . find_by_text ( u "登錄" ) . click ( )

b . fill ( "loginUserDTO.user_name" , "xxxx" )

b . fill ( "userDTO.password" , "xxxx" )

第二部選擇出發地點日期等

通過cookies選擇出發地點,日期及目的地

首先瞧瞧我們的cookies當然是沒有的出發日期什么的

至于你的出發地點及目的地對于的cookies值是什么,就得靠自己去copy了,我幫不了

12306的變態驗證碼算得了什么?我有Python神器!

怎么有的這些值?

先將地點日期輸進去查詢一下,然后chrome按F12  找到這一部分即可

打開瀏覽器跳到這個頁面當然是沒有我們需要的信息的,比如下面這樣

b . cookies . all ( )

{ u 'BIGipServerotn' u '1977155850.38945.0000' ,

u 'JSESSIONID' u '0A01D97598F459F751C4AE8518DBFB300DA7001B67' ,

u '__NRF' u '95D48FC2E0E15920BFB61C7A330FF2AE' ,

u 'current_captcha_type' u 'Z' }

然后我們需要添加出發地,這個得自己去查了,是簡單的 url加密

b . cookies . add ( { "_jc_save_fromStation" : "%u4E0A%u6D77%2CSHH" } )

添加出發日期

b . cookies . add ( { "_jc_save_fromDate" : "2016-01-20" } )

添加目的地

b . cookies . add ( { u '_jc_save_toStation' : '%u6C38%u5DDE%2CAOQ' } )

注:如果是修改的話,還是調用 add方法,如果傳入的字典 key值已存在則替換

比如,將目的地改為其他地方 xxxx,如下即可

b . cookies . add ( { u '_jc_save_toStation' : 'xxxxxx' } )

然后在看看現在的cookies值

b . cookies . all ( )

{ u 'BIGipServerotn' u '1977155850.38945.0000' ,

u 'JSESSIONID' u '0A01D97598F459F751C4AE8518DBFB300DA7001B67' ,

u '__NRF' u '95D48FC2E0E15920BFB61C7A330FF2AE' ,

u '_jc_save_fromDate' u '2016-01-20' ,

u '_jc_save_fromStation' u '%u4E0A%u6D77%2CSHH' ,

u '_jc_save_toStation' u '%u6C38%u5DDE%2CAOQ' ,

u 'current_captcha_type' u 'Z' }

既然cookies已經準備完畢,reload一下,開始查詢吧

b . reload ( )

b . find_by_text ( u "查詢" ) . click ( )

是不是發現,地點日期都填上了,很酷有木有

到這一步我們得確認的是,自己已經登錄了。一切準備就緒了,就可以刷票了。

值得說明的是,上面的步驟都能手工完成。

下面我們需要用組合BeautifulSoup來判斷預訂可不可以點,當然你也可以選擇單點某一趟

反正我只想買高鐵的,既然這樣,下面兩種方法,一是單點一趟,而是輪循著點很多趟,不放過任何機會。

先說第一個方法吧,這個比較簡單,不需要用到其他庫,單用splinter就夠了,就先從簡單的說起吧。

12306的變態驗證碼算得了什么?我有Python神器!

從我自己坐的火車線路來看,一共六趟,我只想做高鐵,那么我一直點高鐵的那一趟預訂是不是就夠了,當然是!!

一共六個預訂,我的預訂在第二個,索引值自然在1了啦。(會python的不會問我為什么的吧!!!)

b.find_by_text(u”預訂”)[1].click()

然后如果預訂成功

應該跳轉到選擇乘客的位置,

我們就需要按需選擇乘客了

12306的變態驗證碼算得了什么?我有Python神器!

b . find_by_text ( u "你的姓名" ) [ 1 ] . click ( )

然后第一種方法基本講解完畢。

上面的步驟摞在一起其實不過100行。

然后應該有第三種方法,就是利用默認的自動查詢,默認是5秒刷新一次,但是大家都知道,春運期間5秒的區間太長了,怎么辦呢?

Chrome的F12一下,點擊Console

12306的變態驗證碼算得了什么?我有Python神器!

輸入autoSearchTime=xxx

默認是毫秒為單位也就是說,默認5000ms,但是不要修改太小,會被偵測到然后報網絡繁忙!!!我改成1000ms似乎只能刷十到十五次就報網絡繁忙了。

其實,用Python刷票也是為了,沒搶到,把刷新頁面定向搶票的進程掛起,我們就不用時時刻刻去刷了,至于源碼,留驅動都在下面的鏈接了~~代 碼還有很多不足,以及寫的不夠優雅,大家可以參考一下,根據實際情況隨便修改~留下的郵箱應該都發完了,一個個發真的發不過來~~

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!