地址:北京市密云區(qū)高嶺鎮(zhèn)政府辦公樓
王經(jīng)理 13393261468
Q Q:514468705/1049705527
郵箱:[email protected]
Uptime Institute的一項(xiàng)調(diào)查研究顯示,高達(dá)十分之一的機(jī)柜運(yùn)行在溫度高于設(shè)備可靠性指導(dǎo)原則所推薦的允許范圍,。目前數(shù)據(jù)中心的機(jī)柜功率密度不斷攀升,,平均每臺機(jī)柜的功率密度達(dá)到5kW甚至更高,因此,,預(yù)計(jì)受熱點(diǎn)困擾的機(jī)柜數(shù)量將與日俱增,,很快超過上述比例。
如果熱點(diǎn)遲遲無法消除,,時間一久便可能帶來嚴(yán)重的威脅,,不僅危及IT設(shè)備的可靠性與性能,還會影響硬件制造商的保修或維護(hù)協(xié)議,。因此,,數(shù)據(jù)中心運(yùn)維人員需盡早采取有效措施,避免出現(xiàn)此類風(fēng)險,。
1. 什么是熱點(diǎn)
許多IT專業(yè)人員經(jīng)常查看熱通道的溫度,,或在冷通道的錯誤位置查看溫度,,一旦發(fā)現(xiàn)溫度過高,便自認(rèn)為發(fā)現(xiàn)了熱點(diǎn),。然后,,他們會采取各種應(yīng)對措施,但結(jié)果可能令人失望,,非但未能消除熱點(diǎn),,反而引發(fā)更多的熱點(diǎn)。搞清究竟什么是熱點(diǎn),、熱點(diǎn)的根本起因以及如何識別熱點(diǎn)對于根除熱點(diǎn)至關(guān)重要,。
(1) 熱點(diǎn)的定義
不能將數(shù)據(jù)中心內(nèi)隨機(jī)測得的任何高溫點(diǎn)都視作熱點(diǎn)。我們將熱點(diǎn)定義為:當(dāng)IT設(shè)備進(jìn)風(fēng)口的溫度高于ASHRAETC9.9所推薦的期望值,,即視作熱點(diǎn),。一般機(jī)柜頂部的位置最容易產(chǎn)生熱點(diǎn)。美國供熱,、制冷與空調(diào)工程師學(xué)會(ASHRAE)的熱指南給出了服務(wù)器進(jìn)風(fēng)口處溫度的推薦值及允許值范圍,。
(2) 熱點(diǎn)產(chǎn)生的根源
數(shù)據(jù)中心所安裝制冷裝置的制冷量經(jīng)常供大于求,特別是當(dāng)制冷量完全由IT設(shè)備“銘牌”上的額定值所決定,。倘若如此,,那么為何還會出現(xiàn)熱點(diǎn)?究其原因,熱點(diǎn)的產(chǎn)生并非是制冷量不足或熱負(fù)荷過大,,而是制冷量未能得到充分的使用,,換句話說,制冷量是充足的,,但未能在需要制冷的區(qū)域提供充分的制冷量,,這是由于缺乏氣流管理所造成的。
圖1是一個制冷量未被充分利用的例子,,這是來自施耐德電氣對一個真實(shí)案例的研究。圖中顯示了一個采用房間級制冷的傳統(tǒng)典型數(shù)據(jù)中心,,它的高架地板和吊頂用作送風(fēng)和回風(fēng)通道,。機(jī)房空調(diào)先是以一定的壓力和速度將冷風(fēng)送入地板通道。然后,,冷風(fēng)通過高架地板中的穿孔地板(占機(jī)房空調(diào)氣流的54%)和地板上線纜切口(占機(jī)房空調(diào)氣流的46%)從地板通道進(jìn)入IT空間(即泄漏氣流),。
地板上線纜切口的泄漏氣流會導(dǎo)致制冷量的損失,因?yàn)闅饬鳠o法到達(dá)IT設(shè)備的前方,,而是繞過了設(shè)備,。事實(shí)上,這些氣流并未帶走任何熱量,,而是又繞回到制冷單元,。
通過穿孔地板的大部分氣流(占穿孔地板風(fēng)量的96.29%)都流經(jīng)IT機(jī)柜中的設(shè)備,,但由于缺乏氣流管理,并非全部氣流都通過設(shè)備,。一小部分冷風(fēng)(占穿孔地板風(fēng)量的3.71%)繞過IT設(shè)備又返回到制冷單元,。與泄漏氣流相同,這些旁通氣流也會造成制冷量損失,。同時,,某些“亟需冷卻”的IT設(shè)備無法獲得足夠的冷量,而不得不從機(jī)柜后部吸入設(shè)備排出的熱風(fēng)(占IT氣流量的7.15%),,這經(jīng)常在“亟需冷卻”的IT設(shè)備的前方造成熱點(diǎn),。簡而言之,用于減少氣流泄漏,、旁通與再循環(huán)的措施將有助于熱點(diǎn)的消除,。
(3) 如何識別熱點(diǎn)
盡早發(fā)現(xiàn)熱點(diǎn)對于防止IT設(shè)備過熱和故障至關(guān)重要。我們可以通過以下三種方法發(fā)現(xiàn)熱點(diǎn):
其他有助于識別或預(yù)防潛在熱點(diǎn)的建議包括利用計(jì)量型機(jī)柜式PDU識別并檢查高密度(功率密度在5kW以上的)機(jī)柜——因?yàn)檫@些機(jī)柜出現(xiàn)熱點(diǎn)的可能性更高。在決定進(jìn)行移動,、添加和更改機(jī)柜操作后或在數(shù)據(jù)中心設(shè)計(jì)階段,,利用CFD軟件預(yù)測熱點(diǎn)。CFD模擬技術(shù)可以提供機(jī)柜前部溫度與壓力云圖以及機(jī)柜周圍氣流分布的詳細(xì)三維分析,,從而發(fā)現(xiàn)潛在熱點(diǎn),。該工具的強(qiáng)大之處在于可以發(fā)現(xiàn)哪些區(qū)域的制冷量被浪費(fèi),哪些區(qū)域存在冷熱氣流混合,,導(dǎo)致制冷量未被充分利用,。
2. 評估所采取的傳統(tǒng)措施
當(dāng)發(fā)現(xiàn)熱點(diǎn),數(shù)據(jù)中心運(yùn)維人員會采取各種應(yīng)對措施,。不過,,并非所有的措施都會奏效。下文將介紹一些傳統(tǒng)的應(yīng)對措施,,并闡述這些措施奏效/無效的原由,。請注意大部分措施對于減少氣流旁通或再循環(huán)根本無濟(jì)于事。
(1) 調(diào)低制冷單元的溫度設(shè)定值
調(diào)低送風(fēng)溫度有助于減少熱點(diǎn)的說法貌似合乎邏輯,,但在處理熱點(diǎn)時實(shí)為不得已而為之的下下之策,,因?yàn)檫@會降低整個制冷系統(tǒng)的效率和制冷量。這種方法的效果取決于機(jī)房空調(diào)的工作狀態(tài),。如果制冷系統(tǒng)尚有多余容量(即工作負(fù)載不足100%,,未達(dá)到制冷極限),那么調(diào)低溫度設(shè)定值的做法具有積極的效果,。對于靠近機(jī)房空調(diào)位置的熱點(diǎn),,調(diào)低溫度設(shè)定值可以降低熱點(diǎn)處的溫度。但倘若機(jī)房空調(diào)正以最大容量(100%滿負(fù)載)運(yùn)行,,由于系統(tǒng)已達(dá)到制冷極限,,調(diào)低溫度設(shè)定值是沒有效果的,所以無法消除熱點(diǎn),。每個制冷系統(tǒng)在給定環(huán)境條件下都有固定的最大制冷容量。溫度設(shè)定值調(diào)低后,,“最大”制冷容量也隨之降低,。
(2) 在熱通道中放置穿孔地板
有人認(rèn)為這方法很好,這是因?yàn)樗麄儾涣私饫渫ǖ?熱通道布局設(shè)計(jì)的優(yōu)勢,,而將所有高溫現(xiàn)象都視作熱點(diǎn),。事實(shí)上,,這種方法非但不能消除冷通道中的熱點(diǎn),還有可能引發(fā)更多熱點(diǎn),。此外,,在熱通道中放置穿孔地板(即造成氣流旁通)還會減少可用的制冷量。冷通道/熱通道布局設(shè)計(jì)是最為行之有效的方法,,因此熱通道中根本不存在熱點(diǎn),。由于冷通道是IT設(shè)備獲取制冷量的“冷量容器”,對于IT設(shè)備而言,,在冷通道內(nèi)保持低溫至關(guān)重要,。在風(fēng)冷型大型設(shè)備盛行初期,往往通過高架地板提供冷量,,制冷單元根據(jù)回風(fēng)溫度進(jìn)行控制,。這種方法之所以奏效是因?yàn)槭覂?nèi)空氣溫度均一,冷熱氣流充分混合,。而如今,,冷通道/熱通道的布局設(shè)計(jì)中特意分別建立冷熱兩個溫度區(qū),形成回風(fēng)溫度的不均一,。習(xí)慣于均一室內(nèi)溫度設(shè)計(jì)的人員可能會在熱通道中放置穿孔地板,,認(rèn)為這樣做就可以解決熱點(diǎn)問題。
(3) 將機(jī)柜和穿孔地板緊靠制冷單元
有人會覺得將機(jī)柜和穿孔地板盡量緊靠制冷單元的做法不錯,,這是因?yàn)樗麄兗俣ǚ胖迷诰嚯x制冷單元幾英尺范圍的機(jī)柜和穿孔地板能獲得較多的制冷量,。但事實(shí)上,效果恰恰相反,。它可能導(dǎo)致IT設(shè)備出現(xiàn)供冷不足的現(xiàn)象,,且無法持續(xù)消除熱點(diǎn)。雖然這一做法可以幫助收集大部分排熱,,但不具有可預(yù)測性,,并不是解決熱點(diǎn)的高效做法。而這種做法導(dǎo)致IT設(shè)備出現(xiàn)供冷不足現(xiàn)象的原因在于,,從制冷單元送出的氣流具有很高的速度,,導(dǎo)致該片區(qū)域內(nèi)的靜壓很低。這也就是說,,該片區(qū)域內(nèi)安裝的穿孔地板的供冷量很小,,甚至可能會將房間內(nèi)的氣流吸入地板通道內(nèi)。
確定高架地板下的氣流是否存在問題有一個很簡單的做法,,那就是在穿孔地板上方放置一小紙片,。如果紙片被吸向穿孔地板內(nèi),則應(yīng)將穿孔地板更換為實(shí)心地板,,以平衡高架地板下的通道壓力,。
(4) 將落地扇置于熱點(diǎn)機(jī)柜前
有人認(rèn)為此舉可將氣流直接集中在某個熱點(diǎn)的前方,,因此是一種消除熱點(diǎn)的好方法。但是,,這種方法只能在緊急狀況下臨時使用,,如IT設(shè)備即將發(fā)生制冷中斷時。這種做法可以降低設(shè)備的運(yùn)行溫度從而消除熱點(diǎn),,但成本極高,。落地扇的作用基本相當(dāng)于一個氣流混合器,將設(shè)備排出的熱風(fēng)與冷風(fēng)混合,,使氣流的溫度介于低送風(fēng)溫度和高排風(fēng)溫度之間,。這還會增加通過設(shè)備的氣流量。冷熱風(fēng)的混合還會降低制冷系統(tǒng)效率,,造成增加除濕/加濕負(fù)擔(dān),,制冷系統(tǒng)容量利用不充分,并可能因制冷冗余造成損失,。此外,,落地扇還會成為數(shù)據(jù)中心內(nèi)的附加熱源。
(5) 將氣流吹過冰并送入冷通道
有人認(rèn)為用冰降溫是一種簡單易行的好方法,。雖然此方法有助于緩解熱點(diǎn)問題,,但冰融化后會變成水,可能溢出容器,,造成嚴(yán)重后果,。即便使用包裝好的冰袋,這種方法也并非上策,,因?yàn)檫€有很多更簡單有效的方法,。我們將在下文中詳細(xì)討論這些方法。
(6) 推入便攜式制冷單元
有人認(rèn)為這是一種解決問題的好方法,,因?yàn)榇伺e可將冷風(fēng)直接集中在某個熱點(diǎn)的前方,。但這種方法只能在緊急狀況下臨時使用,如IT設(shè)備即將發(fā)生制冷中斷時,。遺憾的是,,人們經(jīng)常將這種方法用作永久性解決方案。便攜式制冷單元一般是在失去制冷的情況下應(yīng)急使用,,因?yàn)閿?shù)據(jù)中心工作人員可以很方便地將其推入到位,。然而,對于如何妥善解決遍布數(shù)據(jù)中心的熱點(diǎn)問題,,下面所討論的最佳方法才是首選的永久性解決方案,,不但成本低廉而且非常奏效。
(7) 增加更多制冷單元
有人很自然地將熱點(diǎn)問題與制冷量不足關(guān)聯(lián)起來,因此認(rèn)為增加制冷單元不失為一種理想方法,。然而,在多數(shù)情況下,,制冷量非常充足,,只是由于缺乏氣流管理,導(dǎo)致到達(dá)制冷需求點(diǎn)的制冷量未達(dá)到要求的水平,。此外,,這種方法并非萬能,而且在解決熱點(diǎn)問題的同時還會產(chǎn)生大量費(fèi)用支出,。Uptime Institute的一項(xiàng)調(diào)查研究顯示,,雖然某些IT機(jī)房的制冷量已高達(dá)需求量的15倍,但機(jī)房中仍有7%到20%的機(jī)柜存在熱點(diǎn),。究其原因,,竟是送入的冷風(fēng)繞過了IT設(shè)備的進(jìn)風(fēng)口。正確的解決方案是采用下面所討論的最佳方法,,然后再核定是否需要增加制冷單元,。
3. 消除熱點(diǎn)的新方法
以上方法司空見慣,但我們大都不推薦使用,,因?yàn)檫@些方法對于造成熱點(diǎn)的兩個主要起因(即氣流旁通與再循環(huán))無能為力,。如要杜絕氣流旁通與再循環(huán)現(xiàn)象,必須將冷熱氣流完全分離,,這樣熱點(diǎn)就根本不會存在,。下面的前四種最佳實(shí)踐之所以有效,正是因?yàn)檫@些實(shí)踐解決了氣流旁通或再循環(huán)問題,,或同時解決了這兩個問題,。最后一個新方法只有在氣流管理完全落實(shí)到位之后方可采用。
(1) 管理機(jī)柜氣流
許多熱點(diǎn)的出現(xiàn)是因?yàn)樵O(shè)備排出的熱風(fēng)在機(jī)柜內(nèi)部或機(jī)柜周圍發(fā)生再循環(huán),。因此,,改善機(jī)柜氣流管理對于解決熱點(diǎn)至關(guān)重要。開放的機(jī)柜U空間和進(jìn)出線口是造成熱風(fēng)再循環(huán)的主要原因,,直接導(dǎo)致熱點(diǎn)產(chǎn)生,。改善機(jī)柜氣流狀況最簡單、最經(jīng)濟(jì)有效的方法之一是利用盲板封堵未使用的機(jī)柜U空間,,并在機(jī)柜的進(jìn)出線口位置安裝毛刷,。企業(yè)應(yīng)更新數(shù)據(jù)中心運(yùn)行流程,規(guī)定凡有移動,、添加和更改操作,,便要安裝盲板和毛刷。
某些類型的交換機(jī)和路由器采用側(cè)向氣流。如果在安裝這些設(shè)備的數(shù)據(jù)中心內(nèi),,機(jī)柜氣流采用從前向后的傳統(tǒng)模式,,則交換機(jī)/路由器的排出的熱風(fēng)可能返回進(jìn)風(fēng)口并造成熱點(diǎn)。
我們可以利用機(jī)柜側(cè)向氣流分配單元以可預(yù)測方式直接向側(cè)向氣流設(shè)備送入冷風(fēng),,而不會造成熱點(diǎn),。如果平均制冷總量充足,但在功率密度高于均值的機(jī)柜中產(chǎn)生熱點(diǎn),,此時可以增加風(fēng)機(jī)輔助型設(shè)備,,通過改進(jìn)氣流狀況和增加制冷量來改善制冷效果。風(fēng)機(jī)輔助型設(shè)備設(shè)備可有效地從功率密度為3kW以下負(fù)載的相鄰機(jī)柜“借用”氣流以支持機(jī)柜負(fù)載,。此方法可最大限度地降低機(jī)柜頂部和底部間的溫差,,并防止設(shè)備排出的熱風(fēng)再循環(huán)至機(jī)柜的進(jìn)風(fēng)口。所有排風(fēng)設(shè)備在部署時必須十分小心,,以確保來自相鄰空間的氣流不會造成相鄰機(jī)柜溫度過高,。這些設(shè)備應(yīng)使用UPS供電,避免設(shè)備在斷電期間發(fā)生制冷中斷,。在高密度環(huán)境中,,啟動備用發(fā)動機(jī)期間也可能發(fā)生過熱現(xiàn)象。
(2) 管理機(jī)房氣流
在改善機(jī)柜氣流管理后,,下一個重要步驟是改善機(jī)房內(nèi)的氣流管理,。首先,是密封高架地板中所有的開口,。使用毛刷密封機(jī)柜后部和PDU下面的進(jìn)線口,。導(dǎo)致意外氣流泄漏大都由這些開口造成。還可利用空氣阻尼泡沫或軟墊密封制冷單元周圍的縫隙和其他地板空隙,,在地板缺損的部位鋪上實(shí)心地板,,找出造成氣流旁通的穿孔地板并改用實(shí)心地板。例如,,如果一個空機(jī)柜前鋪了穿孔地板,,則應(yīng)將其換為實(shí)心地板。此外,,還可遵照側(cè)欄中的操作程序?qū)Φ匕逑碌臍饬鬟M(jìn)行重新平衡,。正確鋪設(shè)地板并密封高架地板中的縫隙有助于回收利用損失的制冷量。
另一個導(dǎo)致熱點(diǎn)問題的因素是機(jī)柜頂部上方和機(jī)柜行末端周圍發(fā)生的冷熱氣流混合,。解決這一問題的一個最佳實(shí)踐是通過遏制通道和/或機(jī)柜氣流將冷熱氣流分開,。通道氣流遏制不僅有助于消除熱點(diǎn),與傳統(tǒng)的非氣流遏制數(shù)據(jù)中心設(shè)計(jì)相比還更加節(jié)能,。
可以用一個送風(fēng)設(shè)備替換機(jī)柜的后門,,從而將其變?yōu)橐粋€主動式風(fēng)管機(jī)柜,。需注意這些設(shè)備將使機(jī)柜的總深度增加大約250mm,這可能會增大每兩行相鄰機(jī)柜之間的間距,。通常情況下排入熱通道的熱風(fēng)會被收集起來并向上推送,,然后沿管道進(jìn)入回風(fēng)通道。此舉可防止氣流在機(jī)柜進(jìn)行再循環(huán)并提升制冷系統(tǒng)的效率和制冷量,。主動式獨(dú)立垂直風(fēng)管系統(tǒng)中的風(fēng)扇可支持高達(dá)12kW的機(jī)柜功率密度,,并能克服不佳通道壓力或因服務(wù)器排風(fēng)口線纜過度密集而導(dǎo)致的壓降。但主動式垂直風(fēng)管系統(tǒng)很容易為數(shù)據(jù)中心的其他區(qū)域帶來意想不到的問題,,因此在部署安裝時應(yīng)格外小心。在這些設(shè)備中必須使用盲板和機(jī)柜側(cè)面板,。主動式風(fēng)管系統(tǒng)是耗電設(shè)備,,因此需要監(jiān)控和維護(hù)。
(3) 轉(zhuǎn)移問題負(fù)載
如上所述,,轉(zhuǎn)移問題負(fù)載的方法是在發(fā)現(xiàn)“問題”負(fù)載之后將其轉(zhuǎn)移到低密度機(jī)柜,,從而消除熱點(diǎn)。為機(jī)房配備制冷設(shè)備,,讓機(jī)房冷卻到低于機(jī)柜潛在峰值的一個平均值,,并將負(fù)載分?jǐn)偟綆讉€機(jī)柜,從而將任何負(fù)載超過設(shè)計(jì)平均值的機(jī)柜負(fù)載分流,。請注意,,將設(shè)備負(fù)載分?jǐn)偟蕉鄠€機(jī)柜會使機(jī)柜內(nèi)出現(xiàn)大量未使用的垂直空間。必須用盲板將這些空間密封,,防止制冷性能降低,。如果可以拆除一臺服務(wù)器或其它關(guān)鍵性設(shè)備,此舉幾乎毫無成本卻可解決熱點(diǎn)問題,。
(4) 改變溫濕度傳感器的位置
在多數(shù)陳舊的數(shù)據(jù)中心,,都是在機(jī)房空調(diào)回風(fēng)氣流中安裝溫度探測器,使得氣流具有不可預(yù)測性,。此舉還會導(dǎo)致機(jī)房空調(diào)負(fù)載不均衡,,從而使服務(wù)器進(jìn)風(fēng)口的溫度發(fā)生波動。將溫度探測器轉(zhuǎn)移到送風(fēng)氣流中(這里的送風(fēng)可控制而且可預(yù)測)可使IT設(shè)備進(jìn)風(fēng)口的溫度更加平穩(wěn),。如果與氣流遏制方法結(jié)合使用,,改變溫度探測器的位置還能提高送風(fēng)溫度,從而減少制冷系統(tǒng)的能耗,,同時無需擔(dān)心送風(fēng)溫度是否會有大幅波動,。
(5) 利用數(shù)據(jù)中心基礎(chǔ)設(shè)施管理軟件控制制冷單元的氣流
有些系統(tǒng)可以根據(jù)IT機(jī)柜前方的溫度控制單個機(jī)房的制冷單元。這些系統(tǒng)可使用模糊算法動態(tài)預(yù)測和調(diào)整制冷單元的風(fēng)扇轉(zhuǎn)速,,并測算哪些制冷單元可關(guān)閉,。通過控制進(jìn)入數(shù)據(jù)中心的風(fēng)量可以限制旁通氣流量,。Vigilent制冷系統(tǒng)就是這種系統(tǒng)的一個典型。
4. 結(jié)束語
熱點(diǎn)會嚴(yán)重影響服務(wù)器的可靠性和性能,,甚至?xí)斐煞?wù)器的損壞,。熱點(diǎn)通常出現(xiàn)在IT設(shè)備的進(jìn)風(fēng)口位置,原因包括低效的氣流管理,,如冷氣流泄漏(即氣流旁通)和設(shè)備排出的熱風(fēng)再循環(huán)等問題,。巡視感知溫度、手動測量溫度或自動監(jiān)測是三種識別熱點(diǎn)的主要方法,。
數(shù)據(jù)中心運(yùn)維人員為消除熱點(diǎn),,采用了許多應(yīng)對措施,但大都不盡人意,,有的僅能作為應(yīng)急情況使用,,而有的卻無濟(jì)于事,有的甚至?xí)箚栴}雪上加霜,。消除熱點(diǎn)的最佳實(shí)踐包括機(jī)柜和機(jī)房的氣流管理,、氣流遏制、問題設(shè)備轉(zhuǎn)移,、改變溫度傳感器位置以及通過數(shù)據(jù)中心物理基礎(chǔ)設(shè)施管理軟件控制制冷單元的氣流,。用這些方法解決熱點(diǎn)問題不僅簡單易行,而且成本低廉,,行之有效,。
來源:機(jī)房空調(diào) http://www.kugq.cn/