發布日期:2022-07-15 點擊率:27
近年來,在PICMG協會(PCI Industrial Computer Manufactures Group)所公布的CompactPCI標準規范下,系統整合商可充分享受它所提供的堅固性(Rugged) 、可靠性(Reliability) 、可用性(Availability)及可管理性(Manageability)等模塊化平臺所帶來的好處。其中在系統管理的部份,PICMG協會特別制定了PICMG 2.9的工業標準來加以規范。
PICMG 2.9系經由標準系統管理總線,采用了與IPMI(Intelligent Platform Management Interface)規格兼容的技術來達成系統管理的目的。它能夠讓管理人員直接進行系統的監控,透過遠程管理,得知系統的健康狀況,并且也可達到遠程執行控制CompactPCI板卡,使系統重新開機等管理工作。
本篇文章將分為兩大部份,第一部份將介紹IPMI的基本規格特性;第二部份將介紹如何運用IPMI規格到PICMG 2.9規范上。
一、Intelligent Platform Management Interface (IPMI)
IPMI規格是在1998年由Intel、Dell、HP以及NEC所共同提出的,它提供了一個可跨平臺的標準界面來監控服務器內的一些狀態,如溫度、電壓、風扇等,并且可通過事件發送的形式讓系統管理人員得知目前系統狀況。在2001年IPMI 從1.0版改成1.5版,內容增加了LAN、Serial/Modem、PCI management Bus等系統管理的溝通界面,以及提供了Alerting的功能。2004年Intel于Intel開發者論壇(IDF,Intel Developer Forum)正式發表了IPMI 2.0版,為IT使用者提供了更高的安全性、遠程服務器主機畫面監控(Console Redirection) 、并支持模塊化刀片型服務器(Blade Server)以及向下兼容1.0及1.5版IPMI規格。
IPMI讓系統管理者能夠透過網絡或序列的傳輸形式來監控系統上各種組件的健康狀況,如CPU運作、風扇轉速、系統溫度及電壓等。管理者可以將要監控的部份,設定其感應的臨界值,在IPMI控制器感應到有不正常的情況時,它將整個系統運作的狀態及事件以日志的形式記錄下來,并且經由警示形式,如發mail、送SNMP trap等來通知相關人員處理問題。另外,通過硬件及軟件的配合,IPMI增加了遠程管理及系統回復的功能,讓系統管理者可以在非機器放置地得知系統目前是處于何種狀態,如關機、開機中、OS當機等,并且下達開機、關機和重新開機等命令。
以下將通過簡單的介紹來了解如何設計一個IPMI的系統。
Baseboard Management Controller (BMC)
圖1為整個IPMI架構的示意圖。位于整個架構中心的部份即為我們所謂的Baseboard Management Controller (BMC)。它通過各別的界面來管理整個系統,如系統狀態偵測及事件過濾、電源管理、記錄事件發生時間及系統回復控制,并且透過網絡或串行端口來告知管理人員,另外,它提供了IPMB的總線來和外部的管理控制器互相溝通。
通常一個基本的BMC所提供的界面有以下幾種:
* 系統界面:這組界面用來和系統上的CPU進行溝通,目前主要以LPC界面為主,系統上的CPU可利用固定的傳輸協議對BMC下達IPMI命令。另外,一些BMC的設計廠商也提供了PCI的界面來讓CPU下達命令(必須依據BMC的規格來決定)。
Firmware、BIOS與System Management Software(SMS)
一個IPMI除了BMC主要的硬件組件外,相關輔助的軟件設計也是必須要考慮的一個環節,因為它所呈現的是系統管理者所接觸的控制界面,方便與否及強大的管理會是左右管理者考慮使用這個平臺的一大因素。
由圖2我們可以看出,IPMI的界面以及上層的管理都需求一些軟件來支持,以下將簡略的描述IPMI所涉及到的軟硬件種類:
二、應用IPMI于PICMG 2.9規范上
早期的CompactPCI單板具有自己管理自己的功能,任何一片單板可以自行根據環境的偵測值管理整個系統。隨著應用于高可用性,CompactPCI平臺的使用者對于系統管理的需求也開始增長,單板的系統管理已不能滿足他們的需要。透過固定的管理數據的傳輸,不同架構的CPU系統也可放在同一個Chassis內來集中管理,但是因為管理數據較為重要,所以并不能和原有的PCI總線混合傳輸,因此共享另一種傳輸總線成了另一項需求。另外,對系統進行遠程的監控功能也逐漸受到用戶的歡迎,對于這些需求,PICMG 2.9規范為CompactPCI平臺的提供者帶來了解決的方案。
PICMG 2.9
PICMG 2.9 1.0版本發表于2000年。規范針對CompactPCI背板定義了系統管理的針腳(IPMB_SCI、IPMB_SDA和IPMB_PWR)。透過這些系統管理針腳,再配合IPMI標準,CompactPCI設計者可以很容易地達成系統管理的設計目的。
規范中定義了兩組IPMB總線,第二組IPMB總線是可選的,其內部的聯接是位于CompactPCI的J1及J2上,如表1所示:
其中IPMB_PWR是由一個專用的系統管理電源所提供,這種有別于單板上的電源供給的形式可使得管理CompactPCI單板時,在單板上沒電的情況下仍然能夠工作。IPMB的界面則和IPMI的標準一樣,它能擴充至外部的風扇、電源、機箱溫度監控。典型的IPMB背板互連如圖3所示:
在圖3中,對于背板外部機箱內部的設備,PICMG 2.9定義了一個擴展的IPMB連接頭,用來和系統上的管理控制元相連。在背板上另外可擴充一槽Chassis Management Module (CMM),用來集中管理外圍槽(Peripheral Slots)及系統槽(System Slot),CMM的角色就如IPMI規格內的BMC。
在單板上設計了支持IPMI的控制組件,對于每一片的CompactPCI單板,其系統上都有一個BMC的組件存在。但若整合到一個機箱內,這些BMC的角色則必須要更改成一個PMC (Peripheral Management Controller),其位于IPMB總線上的地址則必須要和唯一的BMC有所區別。CompactPCI規范另行定義了背板上GA (Geographical Address)的針腳,用來提供不同槽位上不同的GA值設定(BMC上的Firmware必須能夠先辨識GA值,然后給予系統上的BMC新的IPMB地址而成為PMC)。
不同形式的系統管理CompactPCI平臺
依據CompactPCI規范及IPMI標準,巧妙地運用規范所提供的解決方案,即可設計出不同形式的CompactPCI系統管理平臺。
PICMG 2.9規范借助于現在的IPMB及IPMI標準,提供了一個管理架構界面。這個標準給CompactPCI使用者提供了一條不依賴PCI總線去控制管理的解決路徑。同時,PICMG 也讓CompactPCI的使用者可以借助RMCP的好處經由IP實現系統的遠程管理。當CompactPCI平臺的使用者在針對系統管理傷腦筋時,或許應該考慮一下使用PICMG 2.9規范兼容的平臺。本篇文章僅以簡單的敘述介紹如何在CompactPCI的平臺上實現系統管理的目的。
作者: 趙瑞文
通訊暨計算機產品事業部
凌華科技