摘要:本文將從數(shù)據(jù)中心運維管理的角度,聯(lián)系現(xiàn)實情況,對運維管理進行研究,期望通過本項目的研究,顯著提升數(shù)據(jù)中心運維治理的整體質(zhì)量。這樣,才能充分發(fā)揮大數(shù)據(jù)的價值,并推動企業(yè)加速發(fā)展。
關鍵詞:大數(shù)據(jù);數(shù)據(jù)中心;遠維管理;策略
0引言
目前,我國經(jīng)濟形勢向好,為我國企業(yè)的發(fā)展創(chuàng)造了有利條件。隨著大數(shù)據(jù)時代的到來,企業(yè)越來越重視數(shù)據(jù)中心的運維管理,現(xiàn)在,需要找到一種切實可行的方法來進行管理,只有這樣,才能保證這些數(shù)據(jù)的價值。
1數(shù)據(jù)中心面臨的問題
1.1預警資料的準確性需要改進
從企業(yè)的角度看,所面對的數(shù)據(jù)信息越來越多,有的與企業(yè)的運營密切相關,雖然可以通過數(shù)據(jù)中心進行分析,但實際效果有待于進一步提升。在實際應用中,數(shù)據(jù)信息的使用數(shù)量很少,特別是對數(shù)據(jù)的深度挖掘還不夠。數(shù)據(jù)是一種特殊的資源,它會直接影響到生產(chǎn)和建設,對于企業(yè)來說,要想實現(xiàn)管理的精細化,就需要要發(fā)揮數(shù)據(jù)信息的作用。根據(jù)目前的現(xiàn)實狀況,在監(jiān)測信息數(shù)據(jù)時,一定要確保信息數(shù)據(jù)的分析更具專業(yè)性,若仍以人工模式,資料的處理將會變得十分困難[1]。目前已有研究表明,人工操作的效率較低,很大地影響了數(shù)據(jù)中心的運營,制約了其進一步的發(fā)展。要成功地解決該問題,可充分運用數(shù)據(jù)挖掘技術(shù),即要將傳統(tǒng)處理方法和優(yōu)勢算法有效地結(jié)合,這樣就能更好地進行數(shù)據(jù)分析和調(diào)查,減少工作人員的工作量。
1.2運維經(jīng)驗知識化
對于一個數(shù)據(jù)中心的操作和維護,要求操作人員需要有豐富的工作經(jīng)驗,所以,新來的員工需要從前輩那里學到東西,才能在短時間內(nèi)提高自己,但這樣做的缺點也很明顯。
一是培訓的全過程要耗費太多的時間。我們知道,在培訓初級運維人員時,他們需要集中精力進行故障檢測、識別等工作,這需要更長的時間和更多的資源。
二是在運行維護工作中,不能忽略有關人員的主觀判斷,但是,這種能力的培養(yǎng)是非常困難的。
三是,如果一個企業(yè)的運維人員離開了公司,那么他們可能不會將自己所學的知識全部教給接班人,這會對運維造成很大的阻礙,嚴重的還會造成企業(yè)的虧損。
要解決這個問題,就需要建立一個完整的數(shù)據(jù)中心,把工作經(jīng)驗轉(zhuǎn)化為專門的知識。在進入大數(shù)據(jù)時代之后,人們能夠獲得的數(shù)據(jù)越來越多,并且獲得的方式也越來越多樣化。這樣就可以鞏固知識庫的建設,收獲的資源也會更多。在此,數(shù)據(jù)主要由內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)兩個部分組成。這里需要指出的是,要對內(nèi)部數(shù)據(jù)、外部數(shù)據(jù)進行全面的分析和轉(zhuǎn)化,并把它們轉(zhuǎn)入知識庫,如此一來,這個問題就可以得到很好的解決,并且在很短的時間里,就可以完成對人才的培訓,從而減少企業(yè)損失。
1.3運維流程標準化需加強
在進行數(shù)據(jù)中心的運維管理時,需要保證所有的流程都是相互的,而為了確保管理和監(jiān)督的順利進行,就需要充分利用智能化平臺,這樣能夠讓管理人員真正地理解到運維的細節(jié),并進行控制,從而針對運維的缺陷進行解決[2]。從當前的智能平臺來看,它的構(gòu)成部分涵蓋了業(yè)務活動的方方面面。要保證對相關的設備實施有效的監(jiān)控,需要結(jié)合具體的條件,制定出一套切實可行的計劃,在遇到緊急情況的時候,可以在*短的時間內(nèi),將工作訂單發(fā)送給有關人員,讓他們在*短的時間內(nèi)完成工作,并且整個過程都是按照規(guī)范的要求來的。
2大數(shù)據(jù)時代數(shù)據(jù)中心運維管理策略
2.1重視管理人員的作用,提高整體素質(zhì)
如果要使數(shù)據(jù)中心的運維管理更加有效,那么管理者就需要做好自己的本職工作。站在企業(yè)的立場上,應注重人才的培養(yǎng),運用更為先進的經(jīng)營思想,而且,還要確定企業(yè)的管理環(huán)境是否*適合。企行業(yè)應當根據(jù)運維管理的真實需求,對他們進行培訓,使得其具有較強的理論基礎和實際應用能力。要采取切實可行的方式,加強運維管理人員的全面文化素質(zhì),確保整個管理隊伍的質(zhì)量有很大的提升,還需要清楚每個員工的責任,彼此之間應當建立密切的合作關系,從而提高協(xié)同管理的有效性,確保了運維管理工作的正常開展,并取得預期的成果。
2.2提高分析業(yè)務環(huán)境的意識
從目前的數(shù)據(jù)中心運維管理現(xiàn)狀來看,問題比較多,技術(shù)升級也比較停滯不前,運營設備太老,管理效率沒有提高等,而造成上述問題的根源在于沒有進行恰當?shù)臉I(yè)務環(huán)境分析。為了確保運維管理的結(jié)果能夠?qū)崿F(xiàn)期望的目標,需要對數(shù)據(jù)信息進行更新,而在建設數(shù)據(jù)中心的過程中,要確保信息技術(shù)的功能得到充分的發(fā)揮,所以,以信息化為導向的創(chuàng)新可以促進數(shù)據(jù)中心的運維管理效果更加理想[3]。在開展運維管理工作時,設備與技術(shù)水平還遠遠達不到要求,相關的人不太了解工作情況,也不太善于分析,要想解決這一問題,我們需要注意以下幾點:首先,我們要給運維管理人員提供必要的信息,讓他們每個人都有一本專業(yè)的手冊,只有這樣,他們才能了解到當前世界的發(fā)展。其次,根據(jù)規(guī)劃,安排有關部門就存在的問題和行業(yè)發(fā)展等進行交流分析,通過這種方式,他們可以更好地理解運維管理的發(fā)展方向,從而更加主動地參與到運維工作中,并貢獻出自己的智慧。第三,要對維護人員進行鼓勵,讓他們以淪為的方式來提升自己的業(yè)務水平,當然,論文的質(zhì)量需要得到控制,期刊的權(quán)威也需要得到評價,在此基礎上,進一步加強了對運維管理工作的了解,提高了對運維管理工作的認識。
2.3建設自動化運維管理平臺
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)中心的發(fā)展速度越來越快,但面臨的挑戰(zhàn)也越來越嚴重。在建立數(shù)據(jù)中心時,需要保證選用一種實用的運維管理模式,*大限度地發(fā)揮自動化平臺的功能,這樣可以很大地提高數(shù)據(jù)處理效率,提高管理的時效性。目前,隨著數(shù)據(jù)中心運維業(yè)務規(guī)模的不斷擴大,為了確保運維管理的全面有效,企業(yè)需要對所選擇的軟件和硬件進行優(yōu)化。在建立自動化運維平臺時,要充分運用遠程控制技術(shù),這樣可以使得數(shù)據(jù)更一致。合理地設置平臺的關聯(lián)和銜接,可以讓平臺的層次劃分更加順暢[4]。此外,由于數(shù)據(jù)中心的運行比較復雜,所以與之有關的運行管理人員對其業(yè)務水平的要求也比較高。在平臺的功能設計中,應先進行業(yè)務的分類,然后保證設置過程的順利實施。
在此要說明的是,在平臺運行的時候,會出現(xiàn)故障,因此,需要要確保自動提示和報警設備的作用*大化,同時能夠順利地傳遞報警信息,從而使問題的處理更加有效。
3安科瑞數(shù)據(jù)中心綜合解決方案
3.1電力監(jiān)控解決方案
電力監(jiān)控系統(tǒng)實現(xiàn)對數(shù)據(jù)中心中低壓配電系統(tǒng)、UPS、蓄電池組、ATS/STS、精密配電柜、電源支路電流、PDU機柜電源以及其它重要設備進行監(jiān)視、測量、記錄、報警等功能,實時掌握供電系統(tǒng)運行狀況和可能存在的隱患,快速排除故障,提高數(shù)據(jù)中心供電可靠性。
3.2電能質(zhì)量治理解決方案
數(shù)據(jù)中心常用設備為不間斷電源系統(tǒng)UPS、LED照明、IT服務器等,易產(chǎn)生諧波電流和三相負載不平衡問題,電能質(zhì)量監(jiān)測和治理裝置可根據(jù)負載運行情況進行實時的檢測、分析并跟蹤治理,為不同負載類型的電能質(zhì)量問題提供合適的設計解決方案,以達到改善供電質(zhì)量和確保電力系統(tǒng)安全經(jīng)濟運行的目的。
3.3智能小母線監(jiān)控解決方案
數(shù)據(jù)中心IT服務器配電傳統(tǒng)采用精密配電柜,占用空間較大,配電線纜多,新增設備不便,為了節(jié)省面積,智能小母線方案由于不占用機房面積、可按需靈活插拔,受到很多數(shù)據(jù)中心的青睞,被越來越多的應用。
安科瑞智能母線監(jiān)控產(chǎn)品分為交流和直流母線監(jiān)控兩類,包括始端箱監(jiān)測模塊、插接箱監(jiān)測模塊以及觸摸屏,另外還可以搭配母線槽連接器紅外測溫模塊用于監(jiān)測母線槽的運行溫度,確保母線槽配電安全。通過標準網(wǎng)線手拉手簡單組網(wǎng),可以實現(xiàn)任意插接箱檢修或更換時不影響其他在線運行的插接箱的數(shù)據(jù)上傳通訊。
3.4動環(huán)監(jiān)控系統(tǒng)解決方案
通過數(shù)據(jù)中心動環(huán)監(jiān)控系統(tǒng),實現(xiàn)了對數(shù)據(jù)中心的門禁狀態(tài)、水浸狀態(tài),煙霧狀態(tài),視頻狀態(tài),環(huán)境狀態(tài),高低壓配電狀態(tài),設備運行狀態(tài)進行實時監(jiān)測,并進行實時報警,保障數(shù)據(jù)中心正常運行,避免運行環(huán)境的失控導致配電設備運行故障,保證維護人員安全,延長設備使用壽命,減少配電室粗放式管理導致成本過高。同時實現(xiàn)動環(huán)監(jiān)控并對各用能耗能進行能效分析,幫助用戶實現(xiàn)用能效率的優(yōu)化。
系統(tǒng)功能
1)展示當前數(shù)據(jù)中心總能耗,IT能耗,空調(diào)能耗,及其他能耗并且計算出當前數(shù)據(jù)中心實時PUE值,通過儀表盤形式直觀展示。
2)選擇查看數(shù)據(jù)中心的中低壓配電系統(tǒng)主接線圖,并在一次圖顯示配電系統(tǒng)當前遙測、遙信數(shù)據(jù)和狀態(tài)。實時監(jiān)測各配電柜的電壓、電流等電力參數(shù),變電站的溫濕度、煙感、水浸、門禁等環(huán)境情況。
3)電氣接點溫度實時監(jiān)測,斷路器觸頭、觸臂、母排和線纜連接等位置安裝無線測溫傳感器監(jiān)測接點溫度,便于提前發(fā)現(xiàn)溫度異常導致的事故。
4)監(jiān)測各變壓器各項參數(shù),包括負載率、頻率、功率因數(shù)、三相不平衡度等,并且顯示歷時曲線圖,數(shù)據(jù)實時變化。幫助用戶直
5)電能質(zhì)量在線監(jiān)測,可以監(jiān)測電流和電壓諧波畸變率、電壓暫升暫降暫中斷等暫態(tài)事件記錄、ITIC容忍曲線等
6)系統(tǒng)采集UPS輸入、輸出端和旁路三相電壓、電流、有功功率、功率因數(shù)頻率,同時監(jiān)測UPS溫度、蓄電池電壓、當前負載下的剩余時間等數(shù)據(jù)。
7)展示單體電池電壓、內(nèi)阻和溫度,預測電池帶載時剩余時間,每節(jié)電池數(shù)據(jù)均可以設置異常報警,及時發(fā)現(xiàn)蓄電池異常。
8)展示精密配電柜內(nèi)進線和饋線回路電氣參數(shù),包括電流電壓功率電能以及開關狀態(tài),并可以對數(shù)據(jù)進行報警設置和分級,數(shù)據(jù)取自精密配電柜測量模塊。
9)展示智能小母線的始端箱和插接箱電氣參數(shù),包括電流電壓、開關狀態(tài)、插接點溫度,并對數(shù)據(jù)進行報警設置和分級。
10)通過平面圖顯示數(shù)據(jù)中心能源分布,設備分布情況,并顯示設備能耗數(shù)據(jù),點擊平面圖上設備可以進入具體設備監(jiān)控界面。
11)實時顯示當前數(shù)據(jù)中心PUE值以及歷史PUE曲線。并且顯示各分項用能的用能情況及用能排行。監(jiān)測各變壓器運行及負載情況,給出本月變壓器輸出電能排行。
12)顯示電能消耗日/月/年報表,并可對具體回路選擇曲線圖、餅圖進行展示。對數(shù)據(jù)中心用電數(shù)據(jù)進行同比、環(huán)比分析比較,查看用電趨勢。
13)監(jiān)測精密空調(diào)的回風溫濕度,出回水溫度,并可以設定精密空調(diào)的溫濕度,達到更好的控制效果。
14)監(jiān)測數(shù)據(jù)中心溫濕度、開關門、水浸、煙霧、噪聲、氣體濃度狀態(tài)等參數(shù)。曲線圖直觀明了,同時支持歷史數(shù)據(jù)查詢
15)通過列表顯示各類報警事件數(shù)量,通過柱狀圖顯示逐日報警數(shù)量,提供報警總數(shù)以及增長趨勢。
16)維管理功能,可針對數(shù)據(jù)中心各主要設備進行巡檢派工,消缺,搶修等維護工作。
3.5蓄電池監(jiān)測系統(tǒng)
安科瑞公司ABAT系列鉛酸蓄電池在線監(jiān)測系統(tǒng)是在線電池監(jiān)測產(chǎn)品,可以提前對失效的鉛酸蓄電池進行預警及電池均衡,符合ANSI/TIA-942標準要求。
該系統(tǒng)具有監(jiān)測電池的電壓、內(nèi)阻與內(nèi)部溫度功能,安裝、維護與接入非常方便。系統(tǒng)主要由ABAT-S模塊、ABAT-C模塊及ABAT-M采集器組成,可通過采集器查詢告警與實時數(shù)據(jù)、設置參數(shù)等,可選配監(jiān)測平臺實現(xiàn)網(wǎng)絡化集中管理。
4平臺部署硬件選型
4.1電力監(jiān)控、電能質(zhì)量監(jiān)測
5結(jié)束語
總之,在目前的時代背景下,數(shù)據(jù)中心運維管理平臺的建立是十分必要的。要主動地與現(xiàn)實情況相結(jié)合,展開全方位的創(chuàng)新,組建一支高質(zhì)量的管理團隊,并積極引入先進的運維管理技術(shù),建立優(yōu)良的管理觀念,加速更新裝備。同時,通過對產(chǎn)業(yè)環(huán)境的理性剖析,適應大數(shù)據(jù)環(huán)境,多角度創(chuàng)新,使數(shù)據(jù)中心在運維管理上更具優(yōu)勢。