Dubbo:來自于阿里巴巴的分布式服務框架

jopen 10年前發布 | 137K 次閱讀 Dubbo WEB服務/RPC/SOA

Dubbo是阿里巴巴SOA服務化治理方案的核心框架,每天為2,000+個服務提供3,000,000,000+次訪問量支持,并被廣泛應用于阿里巴巴集團的各成員站點

Dubbo是一個阿里巴巴開源出來的一個分布式服務框架,致力于提供高性能和透明化的RPC遠程服務調用方案,以及SOA服務治理方案。其核心部分包含:

  • 遠程通訊: 提供對多種基于長連接的NIO框架抽象封裝,包括多種線程模型,序列化,以及“請求-響應”模式的信息交換方式。
  • 集群容錯: 提供基于接口方法的透明遠程過程調用,包括多協議支持,以及軟負載均衡,失敗容錯,地址路由,動態配置等集群支持。
  • 自動發現: 基于注冊中心目錄服務,使服務消費方能動態的查找服務提供方,使地址透明,使服務提供方可以平滑增加或減少機器。
  • </ul>

    Dubbo產生的背景

    隨著互聯網的發展,網站應用的規模不斷擴大,常規的垂直應用架構已無法應對,分布式服務架構以及流動計算架構勢在必行,亟需一個治理系統確保架構有條不紊的演進。

    Dubbo:來自于阿里巴巴的分布式服務框架

    • 單一應用架構

      • 當網站流量很小時,只需一個應用,將所有功能都部署在一起,以減少部署節點和成本。
      • 此時,用于簡化增刪改查工作量的數據訪問框架(ORM) 是關鍵。
      • </ul> </li>

      • 垂直應用架構

        • 當訪問量逐漸增大,單一應用增加機器帶來的加速度越來越小,將應用拆成互不相干的幾個應用,以提升效率。
        • 此時,用于加速前端頁面開發的Web框架(MVC) 是關鍵。
        • </ul> </li>

        • 分布式服務架構

          • 當垂直應用越來越多,應用之間交互不可避免,將核心業務抽取出來,作為獨立的服務,逐漸形成穩定的服務中心,使前端應用能更快速的響應多變的市場需求。
          • 此時,用于提高業務復用及整合的分布式服務框架(RPC) 是關鍵。
          • </ul> </li>

          • 流動計算架構

            • 當服務越來越多,容量的評估,小服務資源的浪費等問題逐漸顯現,此時需增加一個調度中心基于訪問壓力實時管理集群容量,提高集群利用率。
            • 此時,用于提高機器利用率的資源調度和治理中心(SOA) 是關鍵。
            • </ul> </li> </ul>

              Dubbo可以滿足的需求

              Dubbo:來自于阿里巴巴的分布式服務框架

              在大規模服務化之前,應用可能只是通過RMI或Hessian等工具,簡單的暴露和引用遠程服務,通過配置服務的URL地址進行調用,通過F5等硬件進行負載均衡。

              (1) 當服務越來越多時,服務URL配置管理變得非常困難,F5硬件負載均衡器的單點壓力也越來越大。

              此時需要一個服務注冊中心,動態的注冊和發現服務,使服務的位置透明。

              并通過在消費方獲取服務提供方地址列表,實現軟負載均衡和Failover,降低對F5硬件負載均衡器的依賴,也能減少部分成本。

              (2) 當進一步發展,服務間依賴關系變得錯蹤復雜,甚至分不清哪個應用要在哪個應用之前啟動,架構師都不能完整的描述應用的架構關系。

              這時,需要自動畫出應用間的依賴關系圖,以幫助架構師理清理關系。

              (3) 接著,服務的調用量越來越大,服務的容量問題就暴露出來,這個服務需要多少機器支撐?什么時候該加機器?

              為了解決這些問題,第一步,要將服務現在每天的調用量,響應時間,都統計出來,作為容量規劃的參考指標。

              其次,要可以動態調整權重,在線上,將某臺機器的權重一直加大,并在加大的過程中記錄響應時間的變化,直到響應時間到達閥值,記錄此時的訪問量,再以此訪問量乘以機器數反推總容量。

              Dubbo的系統架構

              Dubbo:來自于阿里巴巴的分布式服務框架

              節點角色說明:

              • Provider: 暴露服務的服務提供方。
              • Consumer: 調用遠程服務的服務消費方。
              • Registry: 服務注冊與發現的注冊中心。
              • Monitor: 統計服務的調用次調和調用時間的監控中心。
              • Container: 服務運行容器。
              • </ul>

                上圖中,藍色的表示與業務有交互,綠色的表示只對Dubbo內部交互。上述圖所描述的調用流程如下:

                • 服務容器負責啟動,加載,運行服務提供者。
                • 服務提供者在啟動時,向注冊中心注冊自己提供的服務。
                • 服務消費者在啟動時,向注冊中心訂閱自己所需的服務。
                • 注冊中心返回服務提供者地址列表給消費者,如果有變更,注冊中心將基于長連接推送變更數據給消費者。
                • 服務消費者,從提供者地址列表中,基于軟負載均衡算法,選一臺提供者進行調用,如果調用失敗,再選另一臺調用。
                • 服務消費者和提供者,在內存中累計調用次數和調用時間,定時每分鐘發送一次統計數據到監控中心。
                • </ul>

                  將上面抽象的調用流程圖展開,詳細如圖所示:

                  Dubbo:來自于阿里巴巴的分布式服務框架

                  (1) 連通性:

                  • 注冊中心負責服務地址的注冊與查找,相當于目錄服務,服務提供者和消費者只在啟動時與注冊中心交互,注冊中心不轉發請求,壓力較小
                  • 監控中心負責統計各服務調用次數,調用時間等,統計先在內存匯總后每分鐘一次發送到監控中心服務器,并以報表展示
                  • 服務提供者向注冊中心注冊其提供的服務,并匯報調用時間到監控中心,此時間不包含網絡開銷
                  • 服務消費者向注冊中心獲取服務提供者地址列表,并根據負載算法直接調用提供者,同時匯報調用時間到監控中心,此時間包含網絡開銷
                  • 注冊中心,服務提供者,服務消費者三者之間均為長連接,監控中心除外
                  • 注冊中心通過長連接感知服務提供者的存在,服務提供者宕機,注冊中心將立即推送事件通知消費者
                  • 注冊中心和監控中心全部宕機,不影響已運行的提供者和消費者,消費者在本地緩存了提供者列表
                  • 注冊中心和監控中心都是可選的,服務消費者可以直連服務提供者
                  • </ul>

                    (2) 健狀性:

                    • 監控中心宕掉不影響使用,只是丟失部分采樣數據
                    • 數據庫宕掉后,注冊中心仍能通過緩存提供服務列表查詢,但不能注冊新服務
                    • 注冊中心對等集群,任意一臺宕掉后,將自動切換到另一臺
                    • 注冊中心全部宕掉后,服務提供者和服務消費者仍能通過本地緩存通訊
                    • 服務提供者無狀態,任意一臺宕掉后,不影響使用
                    • 服務提供者全部宕掉后,服務消費者應用將無法使用,并無限次重連等待服務提供者恢復
                    • </ul>

                      (3) 伸縮性:

                      • 注冊中心為對等集群,可動態增加機器部署實例,所有客戶端將自動發現新的注冊中心
                      • 服務提供者無狀態,可動態增加機器部署實例,注冊中心將推送新的服務提供者信息給消費者
                      • </ul>

                        (4) 升級性:

                        當服務集群規模進一步擴大,帶動IT治理結構進一步升級,需要實現動態部署,進行流動計算,現有分布式服務架構不會帶來阻力:

                        Dubbo:來自于阿里巴巴的分布式服務框架

                        Dubbo支持的協議

                        在通信過程中,不同的服務等級一般對應著不同的服務質量,那么選擇合適的協議便是一件非常重要的事情。你可以根據你應用的創建來選擇。例如,使用 RMI協議,一般會受到防火墻的限制,所以對于外部與內部進行通信的場景,就不要使用RMI協議,而是基于HTTP協議或者Hessian協議。 Dubbo支持多種協議,如下所示:

                        • Dubbo協議
                        • Hessian協議
                        • HTTP協議
                        • RMI協議
                        • WebService協議
                        • Thrift協議
                        • Memcached協議
                        • Redis協議
                        • </ul>

                          Dubbo的模塊組成

                          Dubbo以包結構來組織各個模塊,各個模塊及其關系,如圖所示:

                          Dubbo:來自于阿里巴巴的分布式服務框架

                           

                          可以通過Dubbo的代碼(使用Maven管理)組織,與上面的模塊進行比較。簡單說明各個包的情況:

                          • dubbo-common 公共邏輯模塊,包括Util類和通用模型。
                          • dubbo-remoting 遠程通訊模塊,相當于Dubbo協議的實現,如果RPC用RMI協議則不需要使用此包。
                          • dubbo-rpc 遠程調用模塊,抽象各種協議,以及動態代理,只包含一對一的調用,不關心集群的管理。
                          • dubbo-cluster 集群模塊,將多個服務提供方偽裝為一個提供方,包括:負載均衡、容錯、路由等,集群的地址列表可以是靜態配置的,也可以是由注冊中心下發。
                          • dubbo-registry 注冊中心模塊,基于注冊中心下發地址的集群方式,以及對各種注冊中心的抽象。
                          • dubbo-monitor 監控模塊,統計服務調用次數,調用時間的,調用鏈跟蹤的服務。
                          • dubbo-config 配置模塊,是Dubbo對外的API,用戶通過Config使用Dubbo,隱藏Dubbo所有細節。
                          • dubbo-container 容器模塊,是一個Standalone的容器,以簡單的Main加載Spring啟動,因為服務通常不需要Tomcat/JBoss等Web容器的特性,沒必要用Web容器去加載服務。
                          • </ul>

                            參考鏈接:

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!