1.服務(wù)器程序維護
服務(wù)器管理員經(jīng)常忽略計劃維護窗口。不要等到出現(xiàn)故障時才開始維護,要留出時間進行例行的服務(wù)器預(yù)防性維護。
維護頻率取決于服務(wù)器設(shè)備的使用年限、數(shù)據(jù)中心和需要維護的服務(wù)器數(shù)量。例如,與部署在高效微?諝膺^濾、冷卻良好的數(shù)據(jù)中心中的新服務(wù)器相比,位于設(shè)備柜中的老舊服務(wù)器需要更頻繁的檢查。
2.檢查氣流路徑
在服務(wù)器宕機之后,需要目視檢查其外部和內(nèi)部氣流路徑。清除所有可能阻礙冷卻空氣的積塵和碎屑。
從外部空氣入口和出口開始,然后進入系統(tǒng)機箱,查看CPU散熱器和風(fēng)扇部件、內(nèi)存,以及所有冷卻風(fēng)扇葉片和風(fēng)道。從機架上卸下服務(wù)器之后,需要確保服務(wù)器清潔。采用干凈、干燥的壓縮空氣清除防靜電工作區(qū)上的灰塵或碎屑。
3.服務(wù)器硬盤維護
服務(wù)器依靠內(nèi)部硬盤進行引導(dǎo)、工作負載啟動和存儲以及用戶數(shù)據(jù)。磁盤介質(zhì)問題損害了工作負載的性能和穩(wěn)定性,并導(dǎo)致硬盤過早故障。使用“檢查硬盤”實用程序之類的工具來驗證硬盤的完整性,并嘗試恢復(fù)硬盤上的任何壞的扇區(qū)。
4.補丁更新
任何軟件都不應(yīng)具有自動更新。管理員應(yīng)確定是否需要修補程序或升級,然后徹底評估和測試更改。
軟件開發(fā)人員可能無法測試每種可能的硬件和軟件組合,因此需要明智地選擇補丁和更新,以避免性能問題或工作流程中斷。例如,監(jiān)視代理程序補丁可能會導(dǎo)致重要的工作負載問題,因為新代理程序占用的帶寬比預(yù)期的要多。