數(shù)據(jù)中心網(wǎng)絡(luò)監(jiān)控與管理
出處:miky 發(fā)布于:2011-07-30 18:50:49
對網(wǎng)絡(luò)設(shè)備、服務(wù)器和數(shù)據(jù)中心本身的監(jiān)控是數(shù)據(jù)中心重要的任務(wù)之一。大部分相關(guān)規(guī)劃都集中在選擇有效的監(jiān)控解決方案和持續(xù)的數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備管理辦法方面。
隨著電子技術(shù)、計(jì)算機(jī)技術(shù)和通信技術(shù)的發(fā)展,視頻監(jiān)控技術(shù)在許多領(lǐng)域都獲得了廣泛的應(yīng)用。一般遠(yuǎn)程監(jiān)控系統(tǒng)包括本地和遠(yuǎn)程監(jiān)控兩部分。在遠(yuǎn)程監(jiān)控現(xiàn)場和監(jiān)控中心之間通過網(wǎng)絡(luò)通信線路連接。監(jiān)控中心可以任意對各個(gè)現(xiàn)場實(shí)行監(jiān)控,他既可以完成對遠(yuǎn)程現(xiàn)
一個(gè)有效的監(jiān)控方案對數(shù)據(jù)中心網(wǎng)絡(luò)維護(hù)是至關(guān)重要的,這是因?yàn)閺哪撤N程度上來說,數(shù)據(jù)中心在大部分時(shí)間里往往處于無人管理的狀態(tài)。多年來,我有過在許多數(shù)據(jù)中心工作的經(jīng)驗(yàn),根據(jù)我的經(jīng)驗(yàn),基本上不會有人被派來專門盯著數(shù)據(jù)中心等候問題出現(xiàn)。事實(shí)上,可能也不會有人長時(shí)間地待在數(shù)據(jù)中心。畢竟,數(shù)據(jù)中心又冷又吵,所以網(wǎng)絡(luò)管理員更喜歡在其它地方消磨時(shí)間。有時(shí),管理員的工作地點(diǎn)甚至可能與數(shù)據(jù)中心不在同一幢大樓內(nèi)。在從業(yè)之初,我所工作的一家大型保險(xiǎn)公司的數(shù)據(jù)中心就像一個(gè)地下倉庫。雖然數(shù)據(jù)中心是精心打造的,但只有保安人員定期在那里工作,其他人都在距此幾英里之外的另外一棟大樓內(nèi)工作。
數(shù)據(jù)中心網(wǎng)絡(luò)基礎(chǔ)設(shè)施的搭建從很大程度上決定著數(shù)據(jù)中心的性能和效益,因此在搭建過程要考慮諸多因素。而某種程度上說數(shù)據(jù)中心在大部分時(shí)間里往往處于無人管理的狀態(tài),一個(gè)有效的監(jiān)控方案對于數(shù)據(jù)中心網(wǎng)絡(luò)維護(hù)就顯得至關(guān)重要。
任何數(shù)據(jù)中心中重要的任務(wù)之一都是對網(wǎng)絡(luò)設(shè)備,服務(wù)器和數(shù)據(jù)中心本身的監(jiān)控。企業(yè)通常要制定很多的規(guī)劃來選擇有效的監(jiān)控解決方案和研究數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備的管理方法。
無論管理員是在數(shù)據(jù)中心大樓內(nèi)還是在幾英里外的地方工作,都必須配置一套有效的警報(bào)機(jī)制。你不能只是設(shè)想恰巧有人走進(jìn)數(shù)據(jù)中心并注意到控制臺屏幕上顯示了一個(gè)即將出現(xiàn)的問題。這就是為什么確保有一個(gè)良好的網(wǎng)絡(luò)管理和監(jiān)控方案是如此重要的原因所在。如果沒有,那可能只有當(dāng)報(bào)警鈴聲響起時(shí)我們才會意識到出了問題。
需要監(jiān)控什么?
數(shù)據(jù)中心有很多不同的東西需要監(jiān)控,因此我們需要制定大量的數(shù)據(jù)中心監(jiān)控規(guī)劃。有些人很可能認(rèn)為數(shù)據(jù)中心監(jiān)控就是一直密切地觀察服務(wù)器的運(yùn)行,但實(shí)際操作要復(fù)雜得多。但盡管如此,如果我們的服務(wù)器運(yùn)行的是非Windows操作系統(tǒng),它也是無法發(fā)揮作用的。
除了服務(wù)器操作系統(tǒng)和應(yīng)用程序之外,還有很多其它的因素需要我們進(jìn)行監(jiān)控。比如,對數(shù)據(jù)中心溫度的觀察也很重要。大多數(shù)服務(wù)器都配有內(nèi)置安全機(jī)制,當(dāng)服務(wù)器的溫度超出某個(gè)特定值并且可能損壞服務(wù)器時(shí),它就會讓服務(wù)器停機(jī)。一個(gè)好的監(jiān)控解決方案必須能夠及時(shí)數(shù)據(jù)中心環(huán)境的溫度,同時(shí)還應(yīng)該能夠在任何一臺服務(wù)器的溫度開始接近臨界水平時(shí)向我們發(fā)出警報(bào)。
雖然數(shù)據(jù)中心的服務(wù)器虛擬化可以大大提高資源利用率和靈活性,但它也帶來了新的管理和設(shè)計(jì)挑戰(zhàn),常令人誤解的地方是網(wǎng)絡(luò)邊界(或網(wǎng)絡(luò)接入層),在物理網(wǎng)絡(luò)中有交換機(jī)提供網(wǎng)絡(luò)通信,在虛擬世界中也有虛擬交換機(jī)……
現(xiàn)在的數(shù)據(jù)中心網(wǎng)絡(luò)基礎(chǔ)架構(gòu)正在快速地變化,支持虛擬化、云計(jì)算和聚合技術(shù)以少的過載實(shí)現(xiàn)靈活且有彈性的服務(wù)。網(wǎng)絡(luò)人員在創(chuàng)建支持這種新架構(gòu)的網(wǎng)絡(luò)和在變化環(huán)境中采用他們的技術(shù)時(shí)面臨著許多挑戰(zhàn)。
電源管理方面的情況也是類似的。當(dāng)發(fā)生電源中斷時(shí),通常來講備用電源會保持服務(wù)器在預(yù)先設(shè)定的時(shí)間范圍內(nèi)正常運(yùn)行。更加復(fù)雜的數(shù)據(jù)中心也可能會依賴備用發(fā)電機(jī)。在任何情況下,我們都必須關(guān)注能源中斷現(xiàn)象,我們也必須知道在任意給定時(shí)間中需要多少備用電源。
從應(yīng)用領(lǐng)域看,機(jī)房監(jiān)控將會得到越來越廣泛的應(yīng)用。機(jī)房監(jiān)控系統(tǒng)在各行業(yè)領(lǐng)域都對它有迫切的需求。比如,連鎖超市、中大型工廠、重要的政府部門、工商部門、金融機(jī)構(gòu)等,均需要采用分散部署、集中監(jiān)控的系統(tǒng)完成全天候、無人值守的監(jiān)視工作,為其業(yè)務(wù)安全、高效開展保駕護(hù)航。
一個(gè)好的監(jiān)控解決方案必須能夠提醒我們關(guān)注服務(wù)器硬件問題、操作系統(tǒng)故障、應(yīng)用故障、網(wǎng)絡(luò)硬件故障和環(huán)境問題。這可以說是一個(gè)苛刻的要求,同時(shí)這也是為什么說適當(dāng)?shù)囊?guī)劃至關(guān)重要的原因之一。據(jù)我所知,沒有一個(gè)監(jiān)控解決方案可以同時(shí)執(zhí)行所有這些功能。一般來講,網(wǎng)絡(luò)架構(gòu)師需要同時(shí)購置幾種監(jiān)控解決方案,并且將它們都安裝在系統(tǒng)上以發(fā)揮警報(bào)作用。這個(gè)警報(bào)可以以文本信息的形式發(fā)送到管理員的移動通信設(shè)備上,或者以郵件的形式發(fā)送到服務(wù)臺,或是以其它警報(bào)形式提醒管理員。重要的一點(diǎn)是所有的警報(bào)終都必須被匯集到一個(gè)地方。
虛擬化技術(shù)使數(shù)據(jù)中心網(wǎng)絡(luò)監(jiān)控變得復(fù)雜化
當(dāng)我們采購監(jiān)控解決方案時(shí),我們必須銘記這其中有許多因素需要考慮,比如說虛擬化,它會使監(jiān)控過程變得復(fù)雜化。例如,市場上有各種不同的可以監(jiān)控服務(wù)器硬件失效信號的監(jiān)控應(yīng)用軟件。諸如此類的應(yīng)用可以監(jiān)控到過高的服務(wù)器溫度、SMART磁盤警報(bào)、甚至是服務(wù)器制冷電扇的失效。但問題在于,如果監(jiān)控解決方案并不知道它是在監(jiān)控一臺虛擬服務(wù)器,它可能就無法監(jiān)控到會潛在影響服務(wù)器可用性的硬件問題。
監(jiān)控軟件應(yīng)該可以找出主機(jī)服務(wù)器硬件的問題。但是,當(dāng)主機(jī)存在風(fēng)險(xiǎn)時(shí),任何運(yùn)行在主機(jī)上的虛擬機(jī)有可能也會存在風(fēng)險(xiǎn)。因此,當(dāng)使用虛擬機(jī)時(shí),我們需要有一種方法來區(qū)分物理服務(wù)器和虛擬服務(wù)器,并且知道哪些虛擬機(jī)是在哪些主機(jī)服務(wù)器上運(yùn)行。同時(shí),當(dāng)發(fā)生硬件問題時(shí),我們還必須能夠快速地將客戶機(jī)轉(zhuǎn)移到其它主機(jī)服務(wù)器上。
要說的是,管理和監(jiān)控是同步進(jìn)行的。只有管理能力到位才可以實(shí)現(xiàn)良好的監(jiān)控,特別是當(dāng)員工不在現(xiàn)場工作的情況下。例如,當(dāng)管理人員無法及時(shí)到達(dá)出現(xiàn)故障的服務(wù)器來阻止事故發(fā)生,如果監(jiān)測軟件可以告知我們將有重大故障出現(xiàn),這該有多好?這就是說能夠監(jiān)控每臺數(shù)據(jù)中心服務(wù)器和硬件部件并與它們實(shí)現(xiàn)遠(yuǎn)程交互是如此重要的原因所在。
版權(quán)與免責(zé)聲明
凡本網(wǎng)注明“出處:維庫電子市場網(wǎng)”的所有作品,版權(quán)均屬于維庫電子市場網(wǎng),轉(zhuǎn)載請必須注明維庫電子市場網(wǎng),http://www.hbjingang.com,違反者本網(wǎng)將追究相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品出處,并自負(fù)版權(quán)等法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
- 保險(xiǎn)絲與 TVS 前后放置位置之爭2025/9/4 16:15:50
- 保護(hù)接地和保護(hù)接零的區(qū)別及適用范圍2025/9/2 17:07:04
- 10kV配電系統(tǒng)繼電保護(hù)配置與整定值計(jì)算2025/8/13 16:24:26
- 全面解析斷路器越級跳閘:原因、處理與要點(diǎn)總結(jié)2025/7/30 16:25:03
- IGBT 元件短路與過電壓保護(hù)的關(guān)鍵要點(diǎn)解析2025/7/24 15:49:28
- 高速PCB信號完整性(SI)設(shè)計(jì)核心實(shí)操規(guī)范
- 鎖相環(huán)(PLL)中的環(huán)路濾波器:參數(shù)計(jì)算與穩(wěn)定性分析
- MOSFET反向恢復(fù)特性對系統(tǒng)的影響
- 電源IC在惡劣環(huán)境中的防護(hù)設(shè)計(jì)
- 連接器耐腐蝕性能測試方法
- PCB電磁兼容(EMC)設(shè)計(jì)與干擾抑制核心實(shí)操規(guī)范
- 用于相位噪聲測量的低通濾波器設(shè)計(jì)與本振凈化技術(shù)
- MOSFET在高頻開關(guān)中的EMI問題
- 電源IC在便攜式設(shè)備中的設(shè)計(jì)要點(diǎn)
- 連接器結(jié)構(gòu)設(shè)計(jì)常見問題分析









