一、衡量設備可靠性的指標
可靠性是指產品在規定的條件下和規定的時間內,完成規定功能的能力。任何產品不論是機械、電子,還是機電一體化產品都有一定的可靠性,產品的可靠性與實驗、設計和產品的維護有著極大的關系。
衡量可靠性的指標很多,常見的有以下幾種:
1.可靠度R(t),即產品在規定條件下、規定時間內完成規定功能的概率,亦稱平均無故障時間MTBF(mean time between failure);
2.平均維修時間MTTR是指產品從發現故障到恢復規定功能所需要的時間;
3.失效率λ(t),是指產品在規定的使用條件下使用到時刻t后,產品失效的概率。產品的可靠性變化一般都有一定的規律,其特征曲線形狀像浴盆,通常稱之為“浴盆曲線”。在實驗和設計初期,由于產品設計制造中的錯誤、軟件不完善以及元器件篩選不夠等原因而造成早期失效率高;通過修正設計、改進工藝、老化元器件、以及整機試驗等,使產品進入穩定的偶然失效期;使用一般時間后,由于器件耗損、整機老化以及維護等原因,產品進入了耗損失效期。這就是可靠性特征曲線呈“浴盆曲線”型的原因。衡量一個電子產品、尤其是工業類產品最常用的是MTBF,也就是平均無故障時間。
二、溫度和MTBF的關系
由于現代電子設備所用的電子元器件的密度越來越高,這將使元器件之間通過傳導、輻射和對流產生熱耦合。因此,熱應力已經成為影響電子元器件失效率的一個最重要的因素。對于某些電路來說,可靠性幾乎完全取決于熱環境。所以,為了達到預期的可靠性目的,必須將元器件的溫度降低到實際可以達到的低水平。有資料表明:環境溫度每提高10℃,元器件壽命約降低1/2。這就是有名的“10℃法則”。
MTBF測試:目前國外廣泛采用Bellcore的RPP(Reliability Prediction Procedure)來測量設備的MTBF,這其中包括晶體管數量、功率衰減以及環境參數。我們分析其中用風扇散熱的24口網絡交換機的檢測報告,在環境溫度為30℃,40℃,50℃時,無風扇交換機和有風扇交換機的測試結果為:
無風扇散熱 有風扇散熱
30℃ 10年 8年
40℃ 9.5年 7.5年
50℃ 8年 7年
另外,我們通過TSC實驗室的溫度測試中還發現了兩個結果:
1.如果不采用任何散熱措施,一臺24口的交換機(不含光口)正常工作4小時后,它的機內溫度要比周圍的環境溫度高約40℃;而采用風扇降溫的同樣的交換機的機內溫度只比周圍的環境溫度高約15℃。
2.機內溫度達到85℃時,實際上溫度已經開始影響到了機內主板很多芯片器件的壽命,也就是說,如果不采用很好的散熱措施,在外部環境溫度為45——50℃時,交換機的MTBF會大大下降。
由此可見,溫度對于工業網絡產品的影響是非常大的,如果像商用交換機一樣采用風扇降溫,能夠有效降低機內溫度而延長設備的MTBF,但風扇本身的壽命又非常有限(2.28年)(由SANYO FAN DATA SHEET 給出的數據)。
工業類設備不同于商用設備,往往是一開機就常年運行,而且運行的環境也往往較惡劣,沙塵、昆蟲、潮濕都會直接影響風扇的運行。一個質量好的交換機,風扇使用壽命一般在20000小時,風扇到了年限以后,檢測并更換就變得非常重要。因為主動散熱性交換機在設計時散熱主要就是靠風扇散熱,一旦風扇失效而不及時更換,“10℃法則”將會起作用:機內環境溫度每提高10℃,元器件壽命就降低1/2。交換機的機內積熱將會快速導致交換機性能的下降,直至交換機崩潰。因此,工業交換機的散熱系統設計,也就是熱設計就顯得尤為重要了。
三、熱設計
正是由于過高溫度對工業網絡設備的影響是致命的,所以在設計這類產品時,除了設備的元器件要選擇寬溫度范圍的工業級元器件外,更要充分重視設備的熱設計。
電子產品的熱設計主要包括散熱、加裝散熱器和制冷三類技術,這里筆者主要討論工業網絡設備中的散熱技術和加裝散熱器技術。
(一)散熱應用中常采用的方法
一種是傳導散熱方法,可選用導熱系數大的材料來制造傳熱元件,或減小接觸熱阻并盡量縮短熱路徑。
一種是對流散熱方式,對流散熱方式有自然對流散熱和強迫對流散熱兩種方法。自然對流散熱應注意以下幾點:
設計印制板和元器件時必須留出多余空間;
安排元器件時,應注意溫度場的合理分布;
充分重視應用煙囪撥風原理;
加大與對流介質的接觸面積。
強迫對流散熱方式可采用風機(如計算機上的風扇)或雙輸入口推拉方式(如帶換熱器的推拉方式)。
第三種是利用熱輻射特性方式,可以采用加大發熱體表面的粗糙度、加大輻射體周圍的環境溫差,或加大輻射體表面的面積等方法。
(二)加裝散熱器
工業電子類設備在熱設計中,最常采用的方法是加裝散熱器,其目的是控制半導體的溫度,尤其是結溫Tj,使其低于半導體器件的結溫Tjmax,從而提高半導體器件的可靠性。半導體器件和散熱器安裝在一起工作時包含:半導體器件內熱阻RTj、結溫Tj、殼溫Tc、散熱器溫度Tf、環境溫度Ta及半導體器件的使用功率Pc。
散熱器的熱阻RTf應為:RTf=(RTj-Ta)/Pc-RTj-RTc
散熱器熱阻RTf是選擇散熱器的主要依據。Tj、RTj是半導體器件提供的參數,Pc是設計要求的參數,RTc可以從熱設計專業書籍中查到。下面介紹一下散熱器的選擇。
自然冷卻散熱器的選擇
首先計算總熱阻RT和散熱器的熱阻RTf,即:
RT=(Tjmax-Ta)/Pc
RTf=R-RTj-RT。
算出RT和RTf之后,可根據RTf和Pc來選擇散熱器。選擇時,根據所選散熱RTf和Pc曲線,在橫坐標上查出已知Pc,再查出與Pc對應的散熱器的熱阻R'Tf。
按照R'Tf≤RTf的原則,選擇合理的散熱器即可。
2.強迫風冷散熱器的選擇
強迫風冷散熱器在選擇時應根據散熱器的熱阻RTf和風速來選擇合適的散熱器。
3.散熱風扇的設計
普通商用交換機的風扇,工作一直處于全速(Full SPD)狀態,除其造成電能浪費、增大整機噪音外,還會增加不必要的電源發熱,機箱內灰塵過多堆積等。更重要的是風扇在全速狀態時其壽命約為2萬小時,也就是2.28年(由SANYO FAN DATA SHEET 給出的數據),2萬小時后風扇轉速會逐漸下降,給整機帶來不穩定因素。但由于沒有監控單元,這種隱患很難發現:例如當交換機丟包率逐漸上升時,并不容易查到是由于風扇老化轉速降低及灰塵堆積太厚導致機箱內關鍵部件溫度升高所致。
工業交換機應使用高速(High SPD)風扇并帶有智能監控電路,實時監測和控制網絡交換機的運行狀況,例如監控機箱風扇、主交換芯片溫度、機箱溫度,光收發器件溫度等,這也就是我們所說的“智能風扇”。
交換機工作過程中智能監控電路會根據被測元件的溫度或風扇轉速信號自動調節風扇轉速,給網絡交換機散熱。風扇的轉速主要與交換機負載和環境溫度有關。在環境溫度一定時,當交換機數據負載減輕時,功耗減小,風扇轉速自動降低,當交換機數據負載加重時,功耗加大,風扇速轉速自動上升。在數據負載一定的情況下,當交換機處在低溫環境時,風扇轉速自動降低,處在高溫環境時風扇轉速自動升高。在高溫高負載情況下,風扇可處在應急高速(High SPD)狀態,比全速(Full SPD)狀態更能保證網絡安全運行。
4.智能風扇控制器運行特性
采用智能風扇控制技術后可延長風扇壽命,減少機內灰塵堆積、降低風扇噪聲,節約電量使用,保證系統有效工作。另外控制器不僅能對風扇失效停轉、溫度超過警戒線提供報警,而且對于由于老化或風道阻力異常增大、轉速低于正常值或監測點溫度異常升高等前期隱患均能給出相應的中英文語音提示,方便網絡管理人員將事故消滅在萌芽階段。
綜上所述,由于工業以太網交換機所處的環境的特殊性以及使用時的特殊性(不能停機),在對付高低溫,主要是高溫環境時采用的對策與普通交換機有很多不同的。
(1)對于較低功率情況,一般P≤10W時,盡量不采用風扇散熱,而采用自然散熱,如果通過自然對流,或者增大外殼面積、外殼褶皺,或者采用導熱較好的型材,如鋁等。
(2)對于功率較大情況,P≥15W時,尤其是有多個光口,甚至是多個單模光口的情況下,不能靠自然散熱解決問題時,應該采用主動散熱方式解決熱問題。而主動散熱方式目前主要是指加裝風扇,但由于工業網絡設備不能停機且要長期運行的特殊性,風扇的使用應有如下考慮。
①風扇不同于普通電子設備的風扇,它應是智能的,智能風扇在使用壽命以及功能上與普通風扇有質的區別。
②智能風扇應設計為可以熱插撥的,也就是在系統不停機情況下,如果智能風扇系統報警(工作壽命到期等)情況下,可以在線更換風扇。采取了以上熱設計和散熱措施,就可以大大提高網絡設備的MTBF,延長其壽命,從而避開法則,使工業網絡設備的元器件長期工作在一個“穩定,舒適”的溫度環境中,這樣“10℃法則”就不起作用,這樣也就保證了自動化過程中通訊系統的穩定和可靠性。