Empire：一個基于Docker和亞馬遜ECS的開源PaaS平臺

jopen 10年前發布 | 20K 次閱讀 Empire

Heroku已經能很好的滿足很多人的需求，但當我們不斷壯大，問題和瓶頸頻現，為此我們開始尋求解決之道，首先關注的是開源社區中支持Docker的平臺，如Flynn、Deis、CoreOS、Kubernetes等，但都不理想，后通過使用亞馬遜ECS，最后確定了Empire，用Empire完成從Heroku到亞馬遜ECS的無痛遷移，過程與挑戰都在文中做了說明。

Remind是一個適用于師生及家長的通訊應用。老師可以通過它給學生和家長群發信息，高效傳達信息的同時，讓家長更多地參與教學。目前，Remind已經有約100萬名教師用戶和1700萬家長及學生用戶，建立起了強大的通訊網絡。在8月份返校季期間，每天有20萬-30萬名學生下載這款應用，在蘋果應用商店中排名第三，領先于WhatsApp 和推ter，排在第三位。

今天，Remind開源了我們自托管的PaaS系統： Empire。 Empire能為你提供一個基于Docker容器的集群，符合 12因子應用規范，基于強大的亞馬遜EC2 Container Service（ECS，EC2 容器服務）構造而來，具有功能完善的的命令行界面。

已經有了Heroku，且Heroku已經能很好的滿足很多人的需求，為什么我們還需要自己造一套Empire這樣的東西？這篇文章講述了為什么我們決定從Heroku遷移出來，我們遇到了哪些挑戰，以及我們怎么用Empire完成從Heroku到亞馬遜ECS的無痛遷移。

講講一點歷史

在2011年的時候，Remind還是一個托管在Heroku的一個整體單一的Rails應用。那個時候一切都很簡單：一個應用使用幾個 dynos已經足以應付當時不大的流量。當時我們選擇Heroku因為它讓我們能專注于開發產品而無需關心基礎設施（infrastructure），對于一個當時不到十個人的團隊來說，這很重要。回想過去，這無疑是我們做的最好決策之一。

但我們開始壯大

而在今天，事情變得有點不同了。我們有超過50個員工，2500萬客戶，50多個后端服務支撐著產品 - 其中有些是產品的核心部分，其它則是不同團隊開發出來用來滿足各種需求的。為了滿足這種規模，我們用了超過250個Dyno。

我們慢慢發現，我們的發展模式在很多方面看來是獨一無二的。我們打造的是一個給老師使用的產品，在學生的返校季業務會迅速增長 - 每天有多達35萬的新用戶，超過500萬條的消息，每30分鐘系統就會出現一次峰值（heavy spike）。

我們開始意識到，如果想有一個能夠滿足我們業務增長的基礎設施，Heroku可能無法完成這一目標。我們遇到的主要問題有：

缺乏對安全的控制。我們十分推崇微服務/SOA的架構，然后我們有一大堆內部的服務。在Heroku中，每一個服務都暴露在外網，這些服務本身難免有自己的弱點（nasties），因而需要身份認證，DoS防御（DoS mitigation），不斷的打安全補丁等。這跟我們想象的有很大不同。

缺乏可見性（visibility）：我們需要對我們的應用的性能有更加透的認識。盡管Heroku提供了這種可能，卻跟我們想象中的仍有距離，我們需要知道在操作系統和主機的層面都發生了什么。

缺乏靈活性：我們需要構建性能更加強大，不僅僅只是受HTTP管控的服務。我們無法控制路由層（routing layer），因而實現一些中間件如限制速率，添加常見的認證和將路由某路徑的請求到不同的上游服務器等超過了其本應有的難度。

我們的尋道之路

AWS：我們當時已經使用了很多亞馬遜的服務，如Redshift和DynamoDB，因而能直接運行在EC2上是必須的要求。這也能讓我們把這些數據存儲鎖定到特定的安全組（security groups）。

簡易化運維（Operational Simplicity）：Heroku在讓運維的過程（如部署、擴展、配置更新）簡易化方面做的十分出色。我們也希望遷移后仍然能夠保持這個水準。我們不愿意看到部署新應用的時運維人員必須到場，并且我們希望部署能遵循共同的模式。

Docker：這不是一個硬性的要求，但是我們還是想繼續使用容器來作為部署的單元，因為：
- 容器能隔離依賴，封裝的包移植性高，易于發布，很類似Go的包。
- 容器提供了更好的開發環境，因為開發和生產環境的相似度（dev/prod parity）更高。
- 容器能限制我們部署的時候那些不確定的部分。基礎設施（Imutability in infrastructure）中的不可變性有很大的好處。
- 容器能更有效地利用資源，降低成本。
- 容錯性（Resilience）：我們對宕機這一問題的態度十分嚴肅。并且我們知道運行著我們應用和服務的平臺本身應該健壯且容錯性高。同時，無宕機部署也是要求的一部分。

Empire：一個基于Docker和亞馬遜ECS的開源PaaS平臺

講講一點歷史

但我們開始壯大

我們的尋道之路

方案一：使用時下時髦的技術（all the Alphas）

方案二：使用亞馬遜ECS

Empire能給我帶來什么？

現在可以上生產環境嗎？

我應該使用它嗎？

你們為什么不使用XXX？

未來

相關資訊

相關經驗

相關文檔