不為技術而技術:大型網站架構演化解析

jopen 9年前發布 | 21K 次閱讀 架構

短短幾十年國內互聯網發生了翻天覆地的變化,特別是國家支持互聯網發展,提出了“互聯網+”行動計劃,國內各行各業的互聯網更是日新月異。作為一 個九零后小白沒有親身經歷互聯網的演變歷程,如今看的像淘寶、京東、騰訊這樣的大型網站充滿了無數的好奇心,這些網站是怎么運作的,如何處理大量用戶的請 求,如何解決海量的數據庫處理···于是才有對于大型網站架構核心原理以及實例分析一系列的筆記記錄。所有筆記記錄參考《大型網站技術架構核心原理以及案 例分析》,該系列文章沒有太多的代碼展示,著重是對理論知識的描述。

互聯網無處不在,人們的生活受互聯網的席卷發生了巨大的變化,從信息檢索到即時通信,從電子購物到文化娛樂,互聯網已近滲透生活的每個角落,在互 聯網如此跨越式發展進程中,不堪負重的網站架構也帶來了負面的一面,網站頻繁宕機、請求操作延時、用戶信息泄漏等等現象演繹的淋漓盡致。

針對上述種種現象,如何打造一個高可用、高性能、易擴展、可伸縮以及安全的網站?如何讓網站隨業務需求所需而靈活變通?這些將是打造一個大型網站急需要考慮的問題根本所在,通過對《大型網站技術架構核心原理以及案例分析》這本書的學習將一層層揭開其中的面紗。

俗話說的好,“汝欲得之,必先知之”,換而言之也是一個道理,想要解決那些種種現象,你得先清楚大型網站的架構演化。

大型網站軟件系統的特點

相比之傳統的應用系統,大型網站系統有以下特點:

高并發,大流量:面臨高并發用戶,大流量訪問。像google、騰訊同時訪問量可能出現億單位次數。

高可用:系統支持每天24小時運作。

海量數據:需要存儲海量數據并管理,需要大量的服務器來支持。

用戶分布廣泛,網絡情況復雜:許多網站都是全球性服務的,用戶分布的范圍很廣。例如:淘寶網

安全性惡劣:互聯網追求開放性,因而易受到外界攻擊,大型知名網站受到攻擊更是家常便飯。

漸進式發展:幾乎所有的大型網站都是漸進式發展,慢慢壯大的,這也和互聯網架構的發展演化對應。

大型網站架構演化發展歷程

前面已經描述了大型網站系統的特點,而對一個大型網站系統,其架構也是重要的一個環節。

大型網站技術主要的挑戰來自于龐大的用戶、高并發以及海量的數據這三個方面。大型網站的形成就像一顆大樹的成長,歷盡長時間的磨練,最后枝繁葉茂,服務他人。

初始網站架構結構

起初的網站鑒于用戶量、訪問量較少,只需要一臺服務器足以,應用程序、數據庫、文件等其所有資源放在一太服務器上就已經足夠滿足此時的需求,這時候網站的架構就幾個簡單組成部分如下圖

不為技術而技術:大型網站架構演化解析

應用和數據服務分離

隨著網站業務需求的發展,越來越多的用戶進行訪問,此時一臺服務器漸漸不能滿足需求,數據的存儲空間出現屏障。于是應用程序、數據庫、文件三者面 臨分離,各自為首分配一臺服務器,這三臺服務器對硬件的要求各取所需,應用服務器處理大量的業務邏輯,需求更快更大的CPU;數據庫服務器對數據庫的處理 需要快速搜索以及緩存,需求對內存更大,對硬盤讀寫能力更迅速;文件服務器需求放入大量的用戶資源,對硬盤空間要求更大。此時的網站的架構組成部分展示如 下圖

不為技術而技術:大型網站架構演化解析

使用緩存

網站的架構進一步改進后可以滿足了業務的發展,但是隨著網站知名度提升,用戶量的進一步增加,訪問數據相比之前愈加頻繁,數據庫壓力急劇上升導致 網站訪問出現延遲,用戶的性能體驗出現下滑,面臨此時網站出現的性能問題,網站架構設計需要再一次的進化,鑒于網站訪問也遵循二八定律,例如:新浪微博, 只有經常登錄的用戶才會發微博,看微博,而這些用戶對于總用戶數只是冰山一角。既然出現這一現象,那么緩存這部分的數據是不是可以解決這現象呢?網站緩存 可以分為本地緩存和分布式緩存這兩種,二者的區別是本地緩存速度快但是受服務器內存限制緩存的數量有限,而分布式緩存采用的是集群處理,理論上是可以避免 內存瓶頸。此時網站的架構組成部分如下圖

不為技術而技術:大型網站架構演化解析

應用服務器集群改善網站并發能力

使用緩存后,數據庫的壓力得到緩解,但是在面臨網站高峰期時,應用服務器處理單一的請求連接出現瓶頸,萬事都有解決的辦法,只是看你愿不愿去想, 愿不愿去嘗試做,采用集群,集群多臺應用程序服務器分布原有的應用程序服務器,從而實現了系統的可伸縮性,網站架構此時演化成這樣如下圖

不為技術而技術:大型網站架構演化解析

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!