古之技術必有師。: S小魚仔S vCenter Server 5.x Cluster HA 和 DRS

2013年12月24日星期二

S小魚仔S vCenter Server 5.x Cluster HA 和 DRS

所謂「Cluster」就是將「ESXi」群組起來， Cluster 內的機器可以互相支援。
PS
「Cluster」需要安裝「vCenter Server」進行「操作」

vSphere Esxi 5.x Cluster 分為「HA」( High Availability )和「DRS」( Distributed Resource Scheduler )。

DRS Cluster:

當我們創建出一個 DRS Cluster，並將「ESXi」放到「Cluster」裡面設定好以後，從此「Guest VM」就會自己找尋適合它生存的地方，假使這個地方不適合它，它就會自動搬家到別的地方，哪裡有它需要的硬體資源，它就往哪裡去。

VMware希望傳達的觀念是，在虛擬化的世界，不用去關心VM現在處於哪個實體，哪裡有「足夠」的實體資源，「Guest VM」就往哪裡去。

建立「Datacenter」

建立「Cluster」

建立「Cluster」名稱，勾選「Turn On vSphere DRS」

這裡是選擇 DRS 運作方式

「Manual」(手動)，當「Guest VM」開機，或要「vMotion」時都會提供建議，由你自行決定是否依照DRS的建議來執行動作。

「Partially automated」(半自動)，「Guest VM」開機時，由 DRS 決定要「Power On」在哪一個實體機器，但是當「vMotion」時提供建議，由你自行決定要不要「vMotion」。

「Fully Automated」(全自動)，「Guest VM」開機、vMotion都由「DRS」來決定，不會再通知你，也不會有建議值，一切由它自己動作。
PS
「Conservative」是觸發「vMotion」的敏感度依據，越往左邊表示越保守，最左邊等級是「Priority 1」，須符合「Affinity Rule」或進入「Maintenance Mode」才會移動「Guest VM」

Power Management「Off」

配置「EVC」，由於「Esxi」都是虛擬配置，無須進行「配置」，使用「Disable EVC」
PS
「Ehanced VMotion Compatibility」功能，可以讓「近期」不同「CPU」系列，彼此可以互相「vMotion」，如此便可以讓較「舊機型」的服務器與較「新機型」混合「Cluster」。
不同廠商的 CPU (Intel、AMD) 是無法靠 EVC 來互相 vMotion。

啟用「VM Swapfile Location」
PS
「虛擬先生」-「設定 ESX 中 VM 的 Swapfile 加快速度」

確認「配置」清單，點選「Finish」即可

在「Cluster DRS」，建立「Add Host」

自行加入....過程省略

加入完成，就會看到「DRS」資源加總。
點選「Cluster DRS」=>「Summary」就會看到「資源」加總。
PS
有興趣朋友，可以研究，「DSR - Resource Pool (資源池)」

點選「Cluster DRS」=>「DRS」=>「Edit」

可以編輯「之前」，設定「DRS」的「細項」功能

如何得知，「Guest VM」隸屬於「哪一台」Esxi 服務器，點選「其中」Host Esxi =>「Virtual Machines」。

如何在「Cluster DRS」建立「Guest VM」?

PS
「Storage DRS」，依據目前儲存剩餘空間或「I/O」效能，提供建議存放「Guest VM」目前最適合的「datastore」是哪一個。
「Load Balancing」功能則是透過「Storage vMotion」線上移轉「VM Files」，可用於解決儲存設備 I/O 效能瓶頸或空間分配上的問題。

HA Cluster:

vSphere HA 是另一種 Cluster，不同於 DRS，它的作用是避免「將雞蛋放在同一個籃子」的風險。vSphere HA 使用了 Cluster 群組，讓「Hosts」之間可以彼此互相支援，一但有實體機器發生故障的情形，在這個「Host」運作的「VM」，就會「重新啟動」在其他「Host」上，由其他「Host」來接管。

「vMotion」與「DRS」只用於「動態」平衡資源負載，或是有計畫性的「停機維護」，沒有辦法應用於「突然」，非預期性的故障，HA 就是補足這一塊缺角，使整個解決方案圓滿。

在「Data Center」建立「New Cluster」

配置「Cluster」Name、啟用「Turn On vSphere HA」(叢集)

「Host Monitoring Status」(心跳) - 建立叢集後，啟用「主機監控」(Enable Host Monitoring)，檢查叢集內每台 Esxi 主機，如果 Esxi 主機出現故障，則會在叢集內另外一台主機重新啟動「Guest VM」。

「Admission Control」- 「Admission Control Enabled」，禁制違反可用性限制的打開「Guest VM」電源操作，同時保留故障切換容量，不允許在「Guest VM」上執行會減少叢集內的未預留資源。

Admission Control Policy

「Host Failures The Cluster Tolerates」- 叢集允許的「Esxi」故障的數量。

「Percentage Of Cluster Resources Reserved As Failover Spare Capacity」- 作為故障切換空間容量保留的「Cluster」資源百分比，以整體百分比計算「Cluster」資源。

「Specify Failover Hosts」- 指定故障切換「Host Esxi」主機，當有時體機故障時，只要這個「Host Esxi」能夠負載，VM就啟動於這個「Host Esxi」
PS
設定「故障切換」Host Esxi ，您不能使用「vMotion」或「DRS」搬移至該「Host Esxi」，因為此「Host Esxi」是被保留，當作「故障切換」用途。

「VM Restart Priority」-確定主機發生故障後「Guest VM」重新啟動相對順序。

「Guest VM」在「啟動」順序，為「High」、「Medium」、「Low」、「Disable」。

若選擇「Disable」，則會為虛擬機停用「vSphere HA」，當主機出現故障時不會在其他「Esxi」主機上重新啟動虛擬機

High(最高)	Active Directory、SQL server，Mail Server
Medium(中)	IIS Server，FTP Server
Low(低)	IIS Server，No Data Storage

「VM Monitoring」這部份是關於「Host」內部「VM」重新啟動，與實體「Host」無關。

若有安裝「Vm Tools」，啟用「VM Monitoring」功能，則「VMware Tools」會提供「Heart Beats」功能，當「Guest OS」或「應用程式」當機時，接收不到「VMware Tools」傳送「Heart Beats」時，「HA」便會嘗試重新啟動這個「Guest VM」，等級越高「重啟」越頻繁。

啟用「VM Swapfile Location」
PS
「虛擬先生」-「設定 ESX 中 VM 的 Swapfile 加快速度」

檢查「配置」清單，無誤後，點選「Finish」即可

加入「Cluster HA」叢集「Esxi」主機

輸入「Esxi」IP 服務器

「Recent Tasks」，會產生「Log」紀錄，「vCenter Server 5.x」就會發送「FDM agent」(Fault Domain Manager)，到每台「Esxi」服務器，一但裝好「FDM agent」代表「HA Cluster」已經運作完成。
PS
「vCenter Server 5.x」關機，也可「獨立」運作。

完成上述佈署，發現「Esxi」服務器，在「Cluster HA」模式下，會有「驚嘆號」。
點選「任意」Esxi 服務器，選擇「Summary」會出現「提示」Configuration Issues
PS
不影響「HA Cluster」運作

檢查「Esxi」服務器，在「網卡配置」檢查「VMkernel port」

「是/否」啟用「vMotion」和「Management Traffic」(Heartbeat)
PS
第二提示，需要「多一組」 Nas Storage，這裡就不做「配置」

將「Esxi」其中「服務器」進行「關機」

這時候「Esxi」所屬「Guest VM」會顯示「Disconnected」

經過幾秒鐘，就會開始進行「移轉」至，另外一台「Esxi」服務器，到這裡「Cluster HA」大致完成。

將「Esxi」服務器重新開機，然後「重新連線」，加入「HA Cluster」

輸入「IP」與「Esxi」帳號「root」和「密碼」

點選「剛剛」連線完成「Esxi」服務器，選擇「Reconfigure for vSphere HA」，即可重新加入「Cluster HA」成員
PS
「重新掃描」Cluster HA 環境

PS
偵測到實體故障開始，到「VM」重新啟動於另外「Host」運作，整個過程至少會有數分鐘的「Downtime」，並非不會有「停頓」或「停機時間」。
「Cluster DRS」和「Cluster HA」可以同時啟用，但是必須確定「購買授權」，「是/否」包含，「DRS」與「HA」互相結合的話，可達到實體故障切換 VM，重啟後，DRS 在「依據」實體「Host」的負載，以「vMotion」來平衡「Cluster」的硬體資源。

參考資料
「Vmware vSphere 5 虛擬化全面啟動」

4 則留言:

Eldon 提到...: 請問大哥你這邊的範例IP 如下
192.168.0.10
192.168.0.11

所以總共只用了"兩台"機器做成 Cluster HA 對嗎?; 2016年3月21日晚上9:10
S小魚仔S 提到...: 沒有錯..您的觀察還是挺細心的。; 2016年3月26日凌晨1:52
Will 提到...: 請問HA的這個部分，
因為看文章此功能應該是針對host出狀況的時候進行處理，
所以想問問有辦法做到當某台EXSi Host發現底下的VM無回應時，
重新啟動該VM？; 2019年4月2日下午5:47
ddd5986 提到...: 請問一個問題vcenter 6.0這個版本如果帳密已經遺失還有網頁登入頁面也出現503的故帳問題請教一下這樣的vcenter可以救嗎? 這是第一個問題
第二如果要關掉做救援回復帳密的問題我可以在線上關掉vcenter 6.0這台嗎? 它有連結至上20台VM....這些VM是否會有網路中斷的可能?; 2019年11月1日下午5:11

張貼留言

訂閱：張貼留言 (Atom)

S小魚仔S 網誌搜尋

2013年12月24日 星期二

S小魚仔S vCenter Server 5.x Cluster HA 和 DRS

4 則留言:

2013年12月24日星期二