邢留洋 何贊園 湯紅波 朱宇航
摘 ?要: ATCA設備在運維過程中,重要部位的高溫、高壓等情況會造成設備的意外宕機。該文針對該問題設計一種分布式ATCA設備數(shù)據(jù)監(jiān)測系統(tǒng),以實現(xiàn)對設備健康狀況和工作環(huán)境信息的實時監(jiān)測。系統(tǒng)采用GigaDevice公司的32位單片機GD32F450ZKT6作為主控單元,利用UDP傳輸協(xié)議進行通信,配合外圍傳感器對ATCA設備健康信息及工作環(huán)境溫濕度進行實時采樣,并將采樣數(shù)據(jù)存儲與上傳。系統(tǒng)通過以太網(wǎng)和ZigBee兩種組網(wǎng)方式進行遠程監(jiān)測。經(jīng)測試,該系統(tǒng)在實際部署中應用效果良好,為ATCA設備的高效運維提供重要保證。
關鍵詞: ATCA設備; 數(shù)據(jù)監(jiān)測; 系統(tǒng)設計; 數(shù)據(jù)采集; 數(shù)據(jù)傳輸; 遠程監(jiān)測
中圖分類號: TN931+.3?34; TM932 ? ? ? ? ? ? ? 文獻標識碼: A ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)24?0160?06
Design of data monitoring system for distributed ATCA equipment
XING Liuyang1,2, HE Zanyuan2, TANG Hongbo2, ZHU Yuhang2
(1. Zhongyuan Institute of Network Security, Zhengzhou University, Zhengzhou 450000, China;
2. PLA Information Engineering University, Zhengzhou 450000, China)
Abstract: As the high temperature and voltage of important parts of the ATCA equipment during operation and maintenance can cause unexpected downtime, a distributed ATCA equipment data monitoring system is designed to achieve real?time monitoring of equipment health condition and working environment information. In this system, the GD32F450ZKT6, a 32?bit microcontroller of GigaDevice, is used as the main control unit, which can communicate by means of the UDP transport protocol. It cooperates with peripheral sensors to conduct real?time sampling of health information, working environment temperature and humidity of ATCA equipment, and store and upload the sampled data. The system conducts remote monitoring through Ethernet and ZigBee networking. The testing results show that the system works well in actual deployment, which provides important guarantee for the efficient operation and maintenance of ATCA equipment.
Keywords: ATCA equipment; data monitoring; system design; data collection; data transmission; remote monitoring
0 ?引 ?言
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)中心得到了迅速發(fā)展[1],而隨著數(shù)據(jù)中心規(guī)模的不斷擴大,ATCA(Advanced Telecom Computing Architecture)設備不僅宕機事故頻頻發(fā)生,而且也大大增加了運維成本和環(huán)境壓力,給社會各界帶來不同程度的損失[2?3]。因此,如何對ATCA設備及工作環(huán)境進行實時有效地監(jiān)測和管理成為各行各業(yè)關注的重點[4]。
本文設計一種分布式ATCA設備數(shù)據(jù)監(jiān)測系統(tǒng),可以實現(xiàn)分布式ATCA專用設備及其工作環(huán)境的統(tǒng)一管理[5]。為方便被管理設備的接入,本系統(tǒng)采用了基于以太網(wǎng)和ZigBee兩種組網(wǎng)方式,將采集數(shù)據(jù)實時傳輸給上位機,當ATCA設備出現(xiàn)異常狀況時,管理人員能根據(jù)告警信息,采取合適的方案對故障進行定位并處理。
1 ?系統(tǒng)總體結構設計
分布式ATCA設備數(shù)據(jù)監(jiān)測系統(tǒng)總體結構設計如圖1所示,該系統(tǒng)由數(shù)據(jù)采集端和監(jiān)控端組成。其中,數(shù)據(jù)采集端用于進行專用ATCA設備基本運行狀態(tài)信息(場景1)及數(shù)據(jù)中心環(huán)境與動力設備信息的采集(場景2);監(jiān)控端通過以太網(wǎng)和ZigBee兩種組網(wǎng)方式實現(xiàn)上位機與數(shù)據(jù)采集端的數(shù)據(jù)交互。
2 ?系統(tǒng)硬件電路設計
該系統(tǒng)選用兆易創(chuàng)新(GigaDevice)公司生產(chǎn)的高性能、低功耗微處理器GD32F450ZKT6[6],其主要由電源模塊、數(shù)據(jù)采集模塊、數(shù)據(jù)存儲模塊、調(diào)測模塊、靜態(tài)IP配置模塊、數(shù)據(jù)傳輸模塊、LCD顯示模塊以及告警模塊組成。
GD32F450ZKT6作為主控單元,通過各個功能管腳實現(xiàn)對數(shù)據(jù)的采集,傳輸與指令控制;利用MCU內(nèi)集成的11路A/D轉(zhuǎn)換接口采集ATCA設備不同種類的電壓,并設計分壓電路實現(xiàn)對高電壓的檢測;溫度檢測電路可以采集板卡環(huán)境溫度和高功耗器件內(nèi)部溫度;通過以太網(wǎng)/ZigBee多模通信方式將監(jiān)測數(shù)據(jù)實時有效地傳送至上位機;上位機可實時監(jiān)測各個節(jié)點的數(shù)據(jù)信息,并根據(jù)歷史數(shù)據(jù)來分析ATCA運行狀況;數(shù)據(jù)存儲模塊則存儲ATCA板卡靜態(tài)屬性信息和各個傳感器的動態(tài)數(shù)據(jù)。系統(tǒng)硬件結構如圖2所示。
2.1 ?數(shù)據(jù)采集電路
根據(jù)數(shù)據(jù)采集模塊功能需求可以將電路分為兩個部分:溫度測量電路和電壓分壓檢測電路。
為實現(xiàn)對遠程溫度和本地溫度的實時監(jiān)測,本文系統(tǒng)采用板載溫度傳感器和外接溫度傳感器分別檢測板卡環(huán)境溫度和高功耗器件內(nèi)部溫度。本文系統(tǒng)中使用的各個傳感器均為數(shù)字傳感器,故通過I2C總線直接讀取傳感器所轉(zhuǎn)換的數(shù)字量,對溫度閾值進行設置,以聲、光、電等告警方式顯示在數(shù)據(jù)采集器的LCD模塊上,并將異常數(shù)據(jù)傳輸給上位機。
板載溫度傳感器采用Maxim的數(shù)字溫度傳感器DS75U+,電路如圖3所示。DS75U+內(nèi)部集成了熱敏二極管以及數(shù)字量化電路,可直接通過I2C總線與MCU進行數(shù)據(jù)轉(zhuǎn)換。ATCA設備上的高溫點的環(huán)境溫度以及重要器件的內(nèi)部溫度利用外接的雙通道測溫芯片ADT7461實現(xiàn)[7]。ADT7461芯片是一款可與CPU集成的測溫傳感器,可精確測量CPU溫度。
本文系統(tǒng)電壓檢測部分涉及不同種類的電壓,故需設計分壓電路實現(xiàn)對高壓的檢測。本方案設計可檢測11種常用電壓類型(48 V,36 V,12 V,5 V,3.3 V,2.5 V,1.8 V,1.6 V,1.25 V,1 V,0.8 V),能夠滿足大部分應用需求。電壓檢測接口電路如圖4所示。分壓電阻阻值選擇如圖5所示。
本文系統(tǒng)通過采用外接SHT30模塊測量工作環(huán)境的溫濕度情況,以確保ATCA單板工作環(huán)境處在良好狀態(tài)下。此模塊應用數(shù)字量轉(zhuǎn)換技術,具有高可靠性和長期穩(wěn)定性,內(nèi)置濕度和溫度傳感器元件、模擬數(shù)字轉(zhuǎn)換器、信號處理、校準數(shù)據(jù)和I2C接口,工作電壓采用與微處理器相同的3.3 V。
SHT30與單片機通過I2C進行通信,串行數(shù)據(jù)線SDA、串行時鐘輸入SCLK分別與I2C擴展電路中的I2C0_SDA2和I2C0_SCL2相連。PCA9516是由NXP公司生產(chǎn)的一款5路集線器中繼器,可以擴展I2C總線或類似的總線系統(tǒng),只需1個中繼器延遲,不會降低系統(tǒng)性能。PCA9516包含5個雙向開漏緩沖器,專門用于支持I2C總線的標準低級爭用仲裁。除仲裁或時鐘延長外,PCA9516[8]可擴展5個I2C。擴展電路如圖6所示。
2.2 ?電源電路設計
本系統(tǒng)具有多種供電方式選擇,主要供電方式為USB接口5 V供電,除此之外還可通過PCIe接口、SLOT接口直接供電。通過TPS75933穩(wěn)壓芯片產(chǎn)生主控電路工作所需的電壓為3.3 V。利用AD1582基準電壓源產(chǎn)生2.5 V基準電壓輸入MCU的AVREF接口。3.3 V電源電路與2.5 V基準電壓源電路如圖7所示。
2.3 ?數(shù)據(jù)存儲電路
AT24C64是存儲器容量為64 Kbit,電源電壓范圍為1.8~3.6 V的E2PROM程序存儲器,可存儲FRU(現(xiàn)場置換單元)和SDR(傳感器數(shù)據(jù))。本文系統(tǒng)中的2個E2PROM分別用來存儲單板靜態(tài)屬性信息和各傳感器采集的動態(tài)數(shù)據(jù)。
2.4 ?數(shù)據(jù)傳輸電路設計
數(shù)據(jù)傳輸電路主要由兩部分組成,分別是以太網(wǎng)有線傳輸和ZigBee無線傳輸。以太網(wǎng)傳輸作為一種普遍、通用的傳輸模式,其主要用于上位機與各個分布節(jié)點進行數(shù)據(jù)交互;在監(jiān)測ATCA設備工作環(huán)境時需要在機房各個重要位置部署數(shù)據(jù)采集器,此時選擇ZigBee無線傳輸模式。
兩種傳輸模式的共同協(xié)作能有效地確保數(shù)據(jù)傳輸過程中的穩(wěn)定性和可靠性,系統(tǒng)通過內(nèi)嵌的串口電路與ZigBee傳輸模塊進行連接。
數(shù)據(jù)采集器與監(jiān)控端之間采用UDP/IP協(xié)議通信,故需要在采集器硬件電路中設計以太網(wǎng)通信模塊[2],以太網(wǎng)PHY芯片選用NS公司生產(chǎn)的DP583848C實現(xiàn),該芯片支持[10100] M高速全雙工數(shù)據(jù)通信協(xié)議,符合IEEE 802.3協(xié)議規(guī)范,由于MII模式連接MAC和PHY之間的通信需要多達16根信號線,所產(chǎn)生的I/O口需求及功耗較大,故采用RMII模式[9]。以太網(wǎng)PHY驅(qū)動電路設計如圖8所示。
ZigBee模塊采用TI公司的SZ05?L?PRO2,符合ZigBeepro國際規(guī)范。其具有通信距離遠、超低功耗、抗干擾能力強、組網(wǎng)靈活穩(wěn)定等優(yōu)點,可實現(xiàn)“一對多”或“多對多”設備之間數(shù)據(jù)的透明傳輸[10]。此模塊分為協(xié)調(diào)器、路由器和終端節(jié)點,本文系統(tǒng)中只采用協(xié)調(diào)器與終端節(jié)點進行實驗,協(xié)調(diào)器節(jié)點是ZigBee自組網(wǎng)的中心,負責對網(wǎng)絡進行建立以及地址的分配、管理等;終端節(jié)點分布于工作環(huán)境中各個待測區(qū)域,并且每一個終端節(jié)點只對本節(jié)點數(shù)據(jù)進行發(fā)送和接收[11]。ZigBee模塊電路如圖9所示。
2.5 ?其他外圍電路
與微處理器相連的其他外圍電路主要有系統(tǒng)調(diào)試接口電路、靜態(tài)IP設置電路、SPI接口電路、RS 232通信電路、聲光告警電路和LCD顯示電路等。
3 ?系統(tǒng)軟件設計
系統(tǒng)軟件設計通過C語言編程實現(xiàn),在Keil5開發(fā)環(huán)境下進行開發(fā),程序主要實現(xiàn)數(shù)據(jù)采集(傳感器讀?。?、數(shù)據(jù)存儲、數(shù)據(jù)傳輸、數(shù)據(jù)顯示、聲光告警等功能。主程序流程如圖10所示。
3.1 ?數(shù)據(jù)采集設計
數(shù)據(jù)采集程序由MCU與各個傳感器共同完成,主要包括A/D電壓數(shù)據(jù)和各個數(shù)字傳感器數(shù)據(jù)采集。系統(tǒng)上電ADC、I2C和STH30初始化后,啟用定時器中斷。通過調(diào)用函數(shù)get_adc_inserted_value(ADC0, 10),利用內(nèi)部ADC0采集芯片內(nèi)部溫度、基準電壓和電源電壓;通過調(diào)用函數(shù)get_adc_average(ADC2,10),利用ADC2采集外部電壓電路的輸出電壓。根據(jù)ATCA設備各部位實際需要以10次采集的平均值作為本次循環(huán)采集A/D數(shù)據(jù)的值。對于工作環(huán)境溫濕度數(shù)據(jù)的采集,在對STH30模塊初始化后,通過調(diào)用sht30_data_process();函數(shù)完成溫濕度數(shù)據(jù)的采集。數(shù)據(jù)采集流程如圖11所示。
3.2 ?數(shù)據(jù)存儲軟件設計
本文模塊設計采用I2C通信方式進行數(shù)據(jù)存儲,E2PROM上電初始化后,使能時鐘信號,相比于SD卡讀寫命令不易讀寫,I2C通過SDA與SCL直接對E2PROM進行讀寫操作。I2C通信地址跟讀寫方向連在一起構成一個8位數(shù),且當 R/W 位為0時,表示寫方向,所以加上7位地址,其值為“0xA0”,常稱該值為I2C設備的“寫地址”;當R/W位為1時,表示讀方向,加上7位地址,其值為“0xA1”,常稱該值為“讀地址”。E2PROM 芯片中還有一個WP管腳,具有寫保護功能,當該管腳電平為高時,禁止寫入數(shù)據(jù),當管腳為低電平時,可寫入數(shù)據(jù),這里直接接地,不使用寫保護功能。
3.3 ?數(shù)據(jù)傳輸軟件設計
MCU與上位機之間采用UDP通信方式,通過以太網(wǎng)接口進行數(shù)據(jù)交互,并接收來自外部管理員的實時指令,根據(jù)指令類型做出相應的響應。此外部署于工作環(huán)境中的終端節(jié)點通過SHT30所采集到的溫濕度數(shù)據(jù)透傳到協(xié)調(diào)器節(jié)點,協(xié)調(diào)器節(jié)點作為整個ZigBee網(wǎng)絡的中心,創(chuàng)建ZigBee網(wǎng)絡,為節(jié)點分配地址,將從各個終端節(jié)點通過透傳收集到的數(shù)據(jù)通過串口傳輸?shù)揭蕴W(wǎng)接口,而后將數(shù)據(jù)傳輸?shù)缴衔粰C,以此達到監(jiān)測工作環(huán)境的目的。數(shù)據(jù)傳輸流程如圖12所示。
3.4 ?數(shù)據(jù)顯示軟件設計
利用2.4 inch TFT LCD顯示板卡狀態(tài)信息,利于管理員在現(xiàn)場進行直觀的監(jiān)控。本文系統(tǒng)通過SPI通信接口與LCD顯示屏進行通信,LCD初始化后,首先調(diào)用顯示工具欄函數(shù)disp_tool_bar(BLACK, WHITE),然后調(diào)用顯示板卡靜態(tài)信息函數(shù)disp_static_info(BLACK, BLUE),顯示設備IP地址函數(shù)disp_IP_addr(BLACK, BLUE),顯示數(shù)據(jù)名稱函數(shù)disp_data_title(BLACK, WHITE),最后調(diào)用顯示上傳數(shù)據(jù)函數(shù)disp_data_update(BLACK,BLUE)。根據(jù)上傳的傳感器數(shù)據(jù)與設定閾值進行比較,分別顯示相應狀態(tài):顯示告警狀態(tài)disp_
monitor_status(RED,WHITE,0x00)和顯示正常狀態(tài)disp_monitor_status(RED,WHITE,status++)。
4 ?系統(tǒng)測試
傳輸組網(wǎng)測試在實驗室內(nèi)進行。本系統(tǒng)IP地址支持DHCP和靜態(tài)配置兩種方式,實驗中優(yōu)先采用靜態(tài)IP配置方式,并利用板卡撥碼開關設置不同板卡的IP地址。監(jiān)控端采用PC,選用3個數(shù)據(jù)采集卡作為測試對象,通過H3C交換機將監(jiān)控端與板卡進行組網(wǎng)。實驗中采用靜態(tài)IP配置方式,利用板卡撥碼開關設置不同板卡的IP地址,監(jiān)控端設置靜態(tài)IP地址。其中,監(jiān)控端IP地址配置為192.168.51.100,3種板卡分別配置為192.168.51.101~192.168.51.103,端口號為7。實驗搭建的網(wǎng)絡拓撲結構如圖13所示。
上電后按照程序邏輯,各板卡開始數(shù)據(jù)采集,并通過建立與監(jiān)控端的UDP連接,定期上傳數(shù)據(jù)。利用網(wǎng)絡調(diào)試助手進行抓包,可查看監(jiān)控端接收的數(shù)據(jù)報文;服務器發(fā)送查詢指令,查詢溫度傳感器采集數(shù)據(jù)(0x01),從機返回測量溫度值。采集數(shù)據(jù)定時上報與查詢機制如圖14所示。
設置主板溫度閾值為30 ℃,用手模擬溫度升高情況,當傳感器溫度超過設置閾值時,LCD顯示報警信息,板卡LED3閃燈,蜂鳴器發(fā)聲報警,同時將報警信息通過UDP立即上傳至監(jiān)控端。
初步調(diào)試通過后,將數(shù)據(jù)采集板卡分別部署在ATCA設備以及工作環(huán)境重要節(jié)點上,測量3個ATCA設備重要部位實際電壓、溫度(CPU)以及其工作環(huán)境不同節(jié)點的溫濕度值。如表1所示為ATCA設備電壓、溫度實測值,表2為工作環(huán)境不同節(jié)點溫、濕度實測值。
5 ?結 ?論
本文介紹一種基于GD32的分布式ATCA設備數(shù)據(jù)監(jiān)測系統(tǒng)。該系統(tǒng)可實時、有效地采集ATCA設備電壓、溫度及工作環(huán)境的溫、濕度數(shù)據(jù),也可通過以太網(wǎng)/ZigBee兩種傳輸方式結合上位機實現(xiàn)實時查詢、智能分析、數(shù)據(jù)處理等運維功能。結果表明,系統(tǒng)設計穩(wěn)定可靠、實現(xiàn)成本低、功耗可控,對ATCA設備的高效運維具有廣泛的應用前景。
參考文獻
[1] LI C, WANG Z H, HOU X F, et al. Power attack defense: Securing battery?backed data centers [J]. Computer architecture news, 2016, 44(3): 493?505.
[2] MENDEZ J, BOBILLIER V, HAAS S, et al. Design of an AdvancedTCA board management controller (IPMC) [J]. Journal of instrumentation, 2017, 12(3): C03010.
[3] 林博.基于IPMI的ATCA服務器管控的研究與實現(xiàn)[D].武漢:武漢理工大學,2015.
[4] 蔡積淼.基于IPMI的服務器管理的軟硬件設計與實現(xiàn)[D].濟南:山東大學,2017.
[5] 陳鑫麗,郝潤科,張艷.分布式服務器電流監(jiān)測系統(tǒng)設計[J].電子技術應用,2014,40(3):79?81.
[6] 佚名.GigaDevice推出GD32F450系列高性能200 MHz主頻Cortex?M4 MCU[EB/OL].[2016?09?20].http://www.elecfans.com/emb/danpianji/20160912435561.html.
[7] 邵文超,何贊園,張建國.一種應用于ATCA系統(tǒng)的IPMI解決方案[J].單片機與嵌入式系統(tǒng)應用,2014,14(10):8?10.
[8] Anon. PCA9516:5?channel I2C?bus hub [EB/OL]. [2009?11?11]. https://www.nxp.com/cn.
[9] 宋鑫,郭勇,謝興紅.RMII模式以太網(wǎng)PHY芯片DP83848C的應用[J].單片機與嵌入式系統(tǒng)應用,2010(8):50?53.
[10] 姚國風,莊斌,趙大明,等.基于ZigBee無線技術的智能家居系統(tǒng)設計[J].現(xiàn)代電子技術,2016,39(22):81?84.
[11] 吳桐.基于物聯(lián)網(wǎng)的機房監(jiān)測系統(tǒng)設計與實現(xiàn)[D].哈爾濱:黑龍江大學,2017.
作者簡介:邢留洋(1996—),男,河南滎陽人,碩士研究生,主要研究方向為嵌入式技術。
何贊園(1975—),男,河南靈寶人,碩士,副研究員,主要研究方向為電信技術、計算機軟件及應用、互聯(lián)網(wǎng)技術。
湯紅波(1968—),男,湖北孝感人,博士,教授,主要研究方向為移動通信網(wǎng)絡和新型網(wǎng)絡體系結構。
朱宇航(1982—),男,江蘇徐州人,碩士研究生,副教授,主要研究方向為網(wǎng)絡科學。