不管數(shù)據(jù)中心的規(guī)模是像一個立式式衣柜還是一架飛機,甚至是傳言中谷歌正在搭建游艇式數(shù)據(jù)中心,這些要素都是非常關鍵的。
環(huán)境控制
標準化、可預測的環(huán)境是任何高質(zhì)量數(shù)據(jù)中心的基石。這不僅僅是關乎讓設備冷卻、維持適當?shù)臐穸,你還需要考慮滅火、空氣氣流以及功率分配等因素。我曾經(jīng)工作過的一家公司為了確保數(shù)據(jù)中心盡可能一塵不染,要求機房內(nèi)不能存放任何紙板箱。這么做是因為紙板顆粒可能會進入氣流中,潛在地污染服務器,因為分布機制是將冷空氣送到機架前端。這個例子可能有些極端,但是說明了這一點的重要性。
問責
作為一名系統(tǒng)管理員來說,我可以證明大多數(shù)IT人都是專業(yè)且值得信賴的。但是,我并不否認需要在數(shù)據(jù)中心方面有一定的問責制度來追蹤其行為。數(shù)據(jù)中心應該記錄通過準入訪問的登錄信息。訪客應該登錄或者登出,任何時候都保持在監(jiān)督的情況下。應該開啟對網(wǎng)絡、應用、文件資源的審查。最后,每個系統(tǒng)都應該有一個確定的負責人,不管是服務器、路由器、數(shù)據(jù)中心冷卻器還是報警系統(tǒng)。
安全性
物理安全是一個可靠的數(shù)據(jù)中心的基礎。讓你的系統(tǒng)處于嚴密的開啟關閉狀態(tài),僅允許那些獲得授權的人員進入,在配合只允許對服務器、應用和網(wǎng)絡中傳輸?shù)臄?shù)據(jù)進行的必要訪問?梢钥隙ǖ卣f,任何企業(yè)最有價值的資產(chǎn)都是在數(shù)據(jù)中心里。三流的小偷會偷筆記本電腦或者手機。職業(yè)偷盜者會把目光鎖定數(shù)據(jù)中心。門鎖是可以被攻克的,所以我建議同時使用警報器。當然,警報器也可能失效,所以想想你的下一步措施:把服務器機架也鎖上?為你的安全系統(tǒng)配備備用電源?雇傭保安?這取決于你的安全需求,但是要記住,“安全是一段旅程,而不是終點。”
變更管理
你可能會說,變更管理應該歸在“策略”一項下,不過我會說這既是一項策略,也是一種理念。適當變更管理的準則會確保你那個尚未規(guī)劃、討論和商定提供故障措施或者B計劃的數(shù)據(jù)中心不會發(fā)生任何問題。不管是引入新系統(tǒng)還是淘汰舊系統(tǒng),你數(shù)據(jù)中心所有組件的生命周期都應該與變更管理的前景相符合。
策略
每一個涉及數(shù)據(jù)中心的流程背后都應該有它的一套策略,以確保環(huán)境維護和管理。你需要系統(tǒng)訪問和使用的策略。你還應該有數(shù)據(jù)保留的策略——你保存?zhèn)浞荻嚅L時間?你是離站保存這些備份嗎?如果這些備份內(nèi)容過期的話怎么辦?同樣的道理也適用于安裝新系統(tǒng),檢查過時的設備或者服務,以及拆除舊設備——例如,擦除服務器硬盤,捐贈或者回收硬件。
布置
我認識的所有IT專業(yè)人員無不是時間緊迫的。部署新系統(tǒng)可能結果是由于痛苦的最后期限而砍掉了一些細節(jié)——這些細節(jié)似乎總是包括一些讓環(huán)境整潔漂亮的東西。成功的系統(tǒng)實施并不僅僅意味著接入并開啟,還包括通過標準化和可支持的方法把設備集成到數(shù)據(jù)中心內(nèi)。你的服務器機架應該是干凈的、擺放有序的。線纜長度適中,遵循布線指南而不是隨意地鋪設。
冗余
我擁有的第一輛車是一輛藍色福特Pinto.當時它花了我父母400美元,油費是每加侖1美元,我開著它到處走。它有一個備用輪胎經(jīng)常能派上用場。我說這件事并不是為了懷舊,而是為提出一個觀點:即使我的老爺車也具備一定的冗余性。你的數(shù)據(jù)中心應該是更尖端、更昂貴以及非常關鍵的,因此你需要的不僅僅是一個“備用輪胎”來確保它的健康運行。你企業(yè)需要保持運轉的一切事情都應該至少保存兩份,不管是郵件服務器、ISP、數(shù)據(jù)光纖鏈路還是VOIP電話系統(tǒng)虛擬機。三份或者更多在很多情況下也不會有壞處的!
監(jiān)控
監(jiān)控所有系統(tǒng)的正常運行時間和監(jiān)控狀況,將帶來巨大的正面價值,但這只是開始。你還需要監(jiān)控帶寬使用了多少,以及電力、存儲、物理機架空間,以及其他數(shù)據(jù)中心作為一種“商品”提供的任何東西。還有像Nagios這樣的免費工具監(jiān)控一些基本細節(jié),更復雜的解決方案如Dranetz測量功率。流程中還包括停電或者低閥值警報——以確保給你的警報上個保險,這樣就可以是獨立于數(shù)據(jù)中心的。
可擴展性
所以,今天你的公司需要25臺服務器用于包括虛擬化、冗余性、文件服務器、電子郵件、數(shù)據(jù)庫和分析等一系列任務?那么你下個月、明年或者下個十年需要的是什么?確保你有適當規(guī)模的數(shù)據(jù)中心,足夠擴展的容量以增加電力、網(wǎng)絡、物理空間和存儲。如果你的數(shù)據(jù)中心需求不斷增長——如果你的公司是盈利的,那么一定會出現(xiàn)這種情況——那么今天就開始做規(guī)劃吧。為可擴展性規(guī)劃并不是唯一一件事,這是一個持續(xù)的過程。明智的企業(yè)會積極地追蹤和報告這個理念。我在這些報告中看到了一些參考,其中談到了必須盡快填補關鍵領域可擴展性中存在的差距。
文檔記錄
最后一點是適當?shù)摹⒂幸娴、及時的文檔記錄——如果你不嚴格遵循程序的話,你可能在實施過程中忽略這一點。只是羅列一堆關于交換機部署以及服務器接入的圖表還不夠,你的變更管理指南準則要求文檔記錄應該是具有相關性的,所有細節(jié)涉及到的人員都應該能夠獲得。也許聽上去有些變態(tài),但是我一直堅守“被車撞”的規(guī)則。如果我明天被一輛車撞到,大家不用擔心我的工作文檔或者個人文檔是否更新了,因為我每周都會確保所有變更和調(diào)整都被相應地記錄下來。不夸張地說,如果我決定換工作地話,我不會花兩個星期的時間在系統(tǒng)保存上。
這些理念的好處在于它們是與硬件或者軟件完全無關的。無論你的數(shù)據(jù)中心包含運行Linux、Windows還是其他操作系統(tǒng)的服務器,還是僅僅是網(wǎng)絡交換機和大型機的集合,希望這些對于你和你的企業(yè)都是有用的。將所有這些結合到一起,把你的IT環(huán)境想象成一個車輪,數(shù)據(jù)中心是樞紐,這10個要素就是周邊的“輪胎”。