ZooKeeper 是一種分布式協(xié)調服務,用于管理大型主機。在分布式環(huán)境中協(xié)調和管理服務是一個復雜的過程。ZooKeeper 通過其簡單的架構和 API 解決了這個問題。ZooKeeper 允許開發(fā)人員專注于核心應用程序邏輯,而不必擔心應用程序的分布式特性。
ZooKeeper 框架最初是在“Yahoo!"上構建的,用于以簡單而穩(wěn)健的方式訪問他們的應用程序。 后來,Apache ZooKeeper 成為 Hadoop,HBase 和其他分布式框架使用的有組織服務的標準。 例如,Apache HBase 使用 ZooKeeper 跟蹤分布式數(shù)據(jù)的狀態(tài)。
在進一步深入之前,我們了解關于分布式應用的一兩件事情是很重要的。因此,讓我們開始分布式應用的概述的快速討論。
分布式應用可以在給定時間(同時)在網(wǎng)絡中的多個系統(tǒng)上運行,通過協(xié)調它們以快速有效的方式完成特定任務。通常來說,對于復雜而耗時的任務,非分布式應用(運行在單個系統(tǒng)中)需要幾個小時才能完成,而分布式應用通過使用所有系統(tǒng)涉及的計算能力可以在幾分鐘內完成。
通過將分布式應用配置為在更多系統(tǒng)上運行,可以進一步減少完成任務的時間。分布式應用正在運行的一組系統(tǒng)稱為集群,而在集群中運行的每臺機器被稱為節(jié)點。
分布式應用有兩部分, Server(服務器) 和 Client(客戶端) 應用程序。服務器應用程序實際上是分布式的,并具有通用接口,以便客戶端可以連接到集群中的任何服務器并獲得相同的結果。 客戶端應用程序是與分布式應用進行交互的工具。
可靠性 - 單個或幾個系統(tǒng)的故障不會使整個系統(tǒng)出現(xiàn)故障。
可擴展性 - 可以在需要時增加性能,通過添加更多機器,在應用程序配置中進行微小的更改,而不會有停機時間。
透明性 - 隱藏系統(tǒng)的復雜性,并將其顯示為單個實體/應用程序。
競爭條件 - 兩個或多個機器嘗試執(zhí)行特定任務,實際上只需在任意給定時間由單個機器完成。例如,共享資源只能在任意給定時間由單個機器修改。
死鎖 - 兩個或多個操作等待彼此無限期完成。
不一致 - 數(shù)據(jù)的部分失敗。
Apache ZooKeeper是由集群(節(jié)點組)使用的一種服務,用于在自身之間協(xié)調,并通過穩(wěn)健的同步技術維護共享數(shù)據(jù)。ZooKeeper本身是一個分布式應用程序,為寫入分布式應用程序提供服務。
ZooKeeper提供的常見服務如下 :
命名服務 - 按名稱標識集群中的節(jié)點。它類似于DNS,但僅對于節(jié)點。
配置管理 - 加入節(jié)點的最近的和最新的系統(tǒng)配置信息。
集群管理 - 實時地在集群和節(jié)點狀態(tài)中加入/離開節(jié)點。
選舉算法 - 選舉一個節(jié)點作為協(xié)調目的的leader。
鎖定和同步服務 - 在修改數(shù)據(jù)的同時鎖定數(shù)據(jù)。此機制可幫助你在連接其他分布式應用程序(如Apache HBase)時進行自動故障恢復。
高度可靠的數(shù)據(jù)注冊表 - 即使在一個或幾個節(jié)點關閉時也可以獲得數(shù)據(jù)。
分布式應用程序提供了很多好處,但它們也拋出了一些復雜和難以解決的挑戰(zhàn)。ZooKeeper框架提供了一個完整的機制來克服所有的挑戰(zhàn)。競爭條件和死鎖使用故障安全同步方法進行處理。另一個主要缺點是數(shù)據(jù)的不一致性,ZooKeeper使用原子性解析。
以下是使用ZooKeeper的好處:
簡單的分布式協(xié)調過程
同步 - 服務器進程之間的相互排斥和協(xié)作。此過程有助于Apache HBase進行配置管理。
有序的消息
序列化 - 根據(jù)特定規(guī)則對數(shù)據(jù)進行編碼。確保應用程序運行一致。這種方法可以在MapReduce中用來協(xié)調隊列以執(zhí)行運行的線程。
可靠性
原子性 - 數(shù)據(jù)轉移完全成功或完全失敗,但沒有事務是部分的。
更多建議: