2017-11-14 08:45:50
隨著人們對信息數(shù)據(jù)應(yīng)用的處理需求,數(shù)據(jù)中心發(fā)展規(guī)模越來越大,早期通過幾臺服務(wù)器加個網(wǎng)絡(luò)設(shè)備搭建起來的數(shù)據(jù)機(jī)房早已無法滿足現(xiàn)在的需要,數(shù)據(jù)中心服務(wù)器都以千萬臺來計算,這也使得數(shù)據(jù)中心的系統(tǒng)建設(shè)得異常復(fù)雜,數(shù)千臺同時運行,協(xié)調(diào)工作,從而為外界提供各種各樣的服務(wù),這是一個龐大的高速運轉(zhuǎn)的信息系統(tǒng)。它結(jié)合了計算算法、網(wǎng)絡(luò)協(xié)議、通信技術(shù)、通風(fēng)及布線等多學(xué)科多門類的技術(shù),若希望能很好地去駕馭它,需要很多的技術(shù)知識和豐富的管理經(jīng)驗,隨著云計算、大數(shù)據(jù)、人工智能、虛擬化等技術(shù)的引入,雖然表面上由人操控的部分工作減少了,一切都是虛擬化應(yīng)用,這樣其實系統(tǒng)內(nèi)部的處理更為復(fù)雜了,一旦出了問題排查都很困難,甚至都不知道是哪臺物理設(shè)備出了問題或者壞掉,在哪里也不好找。因此,我們要為數(shù)據(jù)中心減負(fù),不要再給數(shù)據(jù)中心增加一些過于復(fù)雜的應(yīng)用部署,要避繁就簡,讓數(shù)據(jù)中心輕裝上陣。
嚴(yán)把需求引入
現(xiàn)在的數(shù)據(jù)中心海納百川,幾乎無所不能,承載著多種應(yīng)用,滿足千萬級用戶數(shù)量的訪問,要實現(xiàn)所有的需要,這樣無疑會給數(shù)據(jù)中心帶來沉重負(fù)擔(dān)。要從源頭入手,控制數(shù)據(jù)中心應(yīng)接各種需求,穩(wěn)定壓倒一切。當(dāng)有需求到來的時候,要結(jié)合數(shù)據(jù)中心當(dāng)前情況,在盡量不改變當(dāng)前環(huán)境狀態(tài)的情況下,看能否滿足需求,如果一定要做變動,要充分評估好風(fēng)險,將改動控制在小范圍內(nèi),避免對原有系統(tǒng)業(yè)務(wù)造成沖擊。我們有的數(shù)據(jù)中心,三天兩頭地做變更,改來改去的后連自己都不知道數(shù)據(jù)中心被改成什么樣子了,運維的人員也很苦逼,天天都要熬夜操作變更,有時在機(jī)房里一熬就是一個通宵。作為數(shù)據(jù)中心的管理者,一定要懂得拒絕,有時開通一項業(yè)務(wù)服務(wù),意味著可以為數(shù)據(jù)中心增加創(chuàng)收,短期看的確對數(shù)據(jù)中心有利,但若影響了原有業(yè)務(wù)群體,造成以往很多忠實客戶的流失,對于數(shù)據(jù)中心就是丟了西瓜撿芝麻。當(dāng)然,我們不能對待一切需求都視而不見,那數(shù)據(jù)中心就沒有發(fā)展了,要審時度勢,根據(jù)數(shù)據(jù)中心當(dāng)前所具備的條件,再仔細(xì)評估需求要求,對數(shù)據(jù)中心未來發(fā)展有好處的,該上馬的項目堅決要上,在各個方面控制好風(fēng)險即可。
簡化網(wǎng)絡(luò)架構(gòu)
以太網(wǎng)協(xié)議是個大家族,RFC已經(jīng)有了六千多篇,常用的網(wǎng)絡(luò)協(xié)議都有上百種,不要一股腦都部署到網(wǎng)絡(luò)中。網(wǎng)絡(luò)的層級結(jié)構(gòu)越簡單越好,哪怕從邊緣服務(wù)器接入,到網(wǎng)關(guān)出口都跑一個大二層都行,只要控制好,避免出現(xiàn)環(huán)路就行,什么MPLS、VXLAN、TRILL、GRE、OSPF協(xié)議等等,部署得越多,網(wǎng)絡(luò)流量處理越復(fù)雜。沒有哪個數(shù)據(jù)中心能有那么多對這些網(wǎng)絡(luò)協(xié)議都很懂的技術(shù)人員,能會使用和配置這些協(xié)議就已相當(dāng)牛了。如果一臺網(wǎng)絡(luò)設(shè)備的配置都要幾千行,那這個數(shù)據(jù)中心的網(wǎng)絡(luò)設(shè)計得一定不好,過于繁瑣了,相信沒有哪個技術(shù)人員能很清楚每行配置的含義,這樣出了問題都不知道該調(diào)整哪里,是哪里的網(wǎng)絡(luò)配置出了問題。很多時候,網(wǎng)絡(luò)廠商為了有賣點,提出各種網(wǎng)絡(luò)解決方案,好是好,數(shù)據(jù)中心要看是否適合自己。假如家里的醬油沒了,出去走一百米都能到超市買到,那何必進(jìn)車庫開汽車去買呢,開汽車是快,可來回停車和取車的時間成本也是很高的,不如直接走去算了,簡單的事情簡單處理,切莫畫蛇添足。數(shù)據(jù)中心的網(wǎng)絡(luò)設(shè)計要一切從簡,網(wǎng)絡(luò)層級要減少,避免網(wǎng)絡(luò)設(shè)備級聯(lián)層數(shù)過多,多控制在三層(接入,匯聚和核心),好保持兩層。網(wǎng)絡(luò)協(xié)議不要部署太多,采用穩(wěn)定的網(wǎng)絡(luò)協(xié)議,而不是生僻少見的協(xié)議,運維人員很容易看懂會操作和配置。在增加數(shù)據(jù)中心建設(shè)規(guī)模的情況下,為了將更多的服務(wù)器接入到數(shù)據(jù)中心中來,網(wǎng)絡(luò)的規(guī)模變得越來越大,網(wǎng)絡(luò)變得盤根錯節(jié),互聯(lián)關(guān)系異常復(fù)雜,網(wǎng)絡(luò)部分變得越來越不可管理,保持網(wǎng)絡(luò)復(fù)雜度不變甚至降低已經(jīng)成為數(shù)據(jù)中心發(fā)展過程中遇到的大訴求。
服務(wù)器統(tǒng)一部署
服務(wù)器是數(shù)據(jù)中心的重要組成部分,數(shù)據(jù)中心對服務(wù)器的需求數(shù)量很大,要讓這些服務(wù)器同時工作,必須統(tǒng)一部署和控制。要引入集群管理,部署虛擬化技術(shù),忽略服務(wù)器之間的硬件差異。將服務(wù)器的計算資源統(tǒng)一起來,自動分配,增加一臺或者減少一臺服務(wù)器,對計算資源只是容量的變化。當(dāng)有服務(wù)器故障時,業(yè)務(wù)自動遷移到其它服務(wù)器上,不影響業(yè)務(wù)運轉(zhuǎn),同時有新服務(wù)器上線時,業(yè)務(wù)也可以平滑過渡到新服務(wù)器上??傊?,要讓業(yè)務(wù)層面感知不到服務(wù)器的硬件變化,服務(wù)器只是數(shù)量上的增加和減少,由集群軟件集中控制,將所有的服務(wù)器計算資源統(tǒng)一調(diào)配?,F(xiàn)在很多數(shù)據(jù)中心都設(shè)計服務(wù)器業(yè)務(wù)自動上線部署,新入網(wǎng)的服務(wù)器,只要將服務(wù)器通過網(wǎng)線連接到數(shù)據(jù)中心的網(wǎng)絡(luò)上,新上線服務(wù)器就可以自動獲取IP地址,然后從版本服務(wù)器上下載操作系統(tǒng),服務(wù)器開始運行,進(jìn)行虛擬化部署,業(yè)務(wù)自動部署到新上線的服務(wù)器上,極大地簡化了服務(wù)器上線的部署工作。這對于擁有上萬臺的大型數(shù)據(jù)中心是非常有意義的,大大減少服務(wù)器部署上線的人力和時間成本。
數(shù)據(jù)中心市場仍在高速發(fā)展著,數(shù)據(jù)中心的不斷擴(kuò)展使得現(xiàn)有的系統(tǒng)環(huán)境變得愈加復(fù)雜,這將引發(fā)一系列的安全危機(jī)、可靠性降低、維護(hù)管理復(fù)雜等問題,我們要為數(shù)據(jù)中心減負(fù)。除了以上這些減負(fù)措施,在節(jié)能、安全、存儲等方面也都要考慮簡化設(shè)計,避繁就簡。