華為助力某大學(xué)超算云計(jì)算中心解決方案
一、 客戶背景
某大學(xué)云計(jì)算產(chǎn)業(yè)園依托學(xué)??蒲辛α?,整合校內(nèi)學(xué)科資源,建設(shè)技術(shù)開發(fā)平臺(tái),引導(dǎo)科研資源向大數(shù)據(jù)應(yīng)用方向傾斜,云計(jì)算產(chǎn)業(yè)園運(yùn)營的業(yè)務(wù)范圍覆蓋云計(jì)算、超級(jí)計(jì)算、空間信息、移動(dòng)互聯(lián)網(wǎng)等領(lǐng)域,將為政府部門及企業(yè)用戶提供廣泛的數(shù)據(jù)與基礎(chǔ)設(shè)施服務(wù)。
其中,云計(jì)算中心依托高速互聯(lián)網(wǎng)接入和大規(guī)模網(wǎng)絡(luò)互聯(lián),采用最新的云計(jì)算技術(shù),依托超級(jí)計(jì)算中心的強(qiáng)大基礎(chǔ)設(shè)施,為云應(yīng)用的發(fā)布、托管和云服務(wù)支撐提供前后端一體化的支持,通過對(duì)計(jì)算機(jī)硬件資源的虛擬化和靈活調(diào)度,面向企事業(yè)單位提供彈性云計(jì)算服務(wù),根據(jù)不同用戶的個(gè)性化需求定制解決方案及服務(wù)模式。超級(jí)計(jì)算中心的計(jì)算能力高達(dá)1170萬億次/秒,是某地區(qū)最大的超算中心,在全國區(qū)域超算中心中僅次于上海超算中心,能夠滿足海量數(shù)據(jù)處理需求,為科研和高端裝備制造、生物制藥、動(dòng)漫與影視渲染、高分辨率遙感應(yīng)用等用戶提供快捷、優(yōu)質(zhì)的計(jì)算服務(wù)??臻g信息中心將為現(xiàn)代農(nóng)業(yè)、防災(zāi)減災(zāi)、資源環(huán)境、公共安全、城市精細(xì)化管理等關(guān)系國計(jì)民生的領(lǐng)域提供數(shù)據(jù)服務(wù)、數(shù)據(jù)加工、咨詢報(bào)告以及解決方案等。移動(dòng)互聯(lián)網(wǎng)借助一站式運(yùn)營支撐系統(tǒng),使開發(fā)者與行業(yè)用戶得到移動(dòng)應(yīng)用的運(yùn)營支持,實(shí)現(xiàn)電子商務(wù)的精準(zhǔn)營銷以及移動(dòng)政務(wù)、商務(wù)信息的聚合、分析和服務(wù)等目標(biāo)。與此同時(shí),云計(jì)算產(chǎn)業(yè)園還具備國家級(jí)數(shù)據(jù)基礎(chǔ)設(shè)施,提供高強(qiáng)度的網(wǎng)絡(luò)安全環(huán)境,安全設(shè)施符合國家信息安全等級(jí)保護(hù)五級(jí)標(biāo)準(zhǔn),能夠提供專業(yè)的網(wǎng)絡(luò)安全、信息安全與數(shù)據(jù)安全保障體系,并提供全方位的基礎(chǔ)設(shè)施服務(wù),可以實(shí)現(xiàn)主機(jī)托管、主機(jī)租賃以及帶寬租賃服務(wù)。
二、解決方案
方案按照“一個(gè)云數(shù)據(jù)中心,多個(gè)業(yè)務(wù)集群資源復(fù)用”的架構(gòu)原則建設(shè),統(tǒng)一設(shè)計(jì)基礎(chǔ)設(shè)施資源,數(shù)據(jù)中心按照綠色模塊化架構(gòu)設(shè)計(jì)。項(xiàng)目一期建設(shè)擬先建設(shè)統(tǒng)一的云計(jì)算平臺(tái)以及數(shù)據(jù)中心網(wǎng)絡(luò)、存儲(chǔ)等部分。
總體方案的核心設(shè)計(jì)思路為:“融合”、“分層”、“分區(qū)”:
融合:為了簡化運(yùn)維,真正地實(shí)現(xiàn)統(tǒng)一、高效、靈活地使用超算及云計(jì)算中心的IT基礎(chǔ)設(shè)施資源,方案中采用“一個(gè)云管理平臺(tái)”的方式,利用華為RH2288 V2和RH5885服務(wù)器承載超算業(yè)務(wù)以及云計(jì)算業(yè)務(wù),整個(gè)數(shù)據(jù)中心可以實(shí)現(xiàn)平滑擴(kuò)容,靈活地對(duì)物理資源與云計(jì)算虛擬資源實(shí)現(xiàn)統(tǒng)一管理與調(diào)度。
分層:在IT基礎(chǔ)設(shè)施實(shí)現(xiàn)融合的基礎(chǔ)上,分層架構(gòu)云計(jì)算服務(wù)平臺(tái),超算服務(wù)平臺(tái),作為其上各種業(yè)務(wù)應(yīng)用構(gòu)建的支撐。網(wǎng)絡(luò)上,將數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)計(jì)中分為核心層與接入層,實(shí)現(xiàn)扁平的二層網(wǎng)絡(luò)架構(gòu)。
分區(qū):根據(jù)數(shù)據(jù)中心不同業(yè)務(wù)功能區(qū)域的隔離需求,將數(shù)據(jù)中心網(wǎng)絡(luò)分成多個(gè)業(yè)務(wù)區(qū)域,各業(yè)務(wù)區(qū)域之間通過相應(yīng)技術(shù)實(shí)現(xiàn)網(wǎng)絡(luò)邏輯隔離;根據(jù)數(shù)據(jù)中心網(wǎng)絡(luò)高效交換的需求,將數(shù)據(jù)中心存儲(chǔ)網(wǎng)絡(luò)和業(yè)務(wù)網(wǎng)絡(luò)分離,保證業(yè)務(wù)數(shù)據(jù)與存儲(chǔ)數(shù)據(jù)之間互不影響。
采用了虛擬化技術(shù),云平臺(tái)的管理系統(tǒng)與計(jì)算資源和存儲(chǔ)資源需要在內(nèi)交換大量的管理和監(jiān)控?cái)?shù)據(jù);虛擬機(jī)需要掛載存儲(chǔ)池的存儲(chǔ)資源,也需要海量的數(shù)據(jù)在數(shù)據(jù)中心網(wǎng)內(nèi)傳輸;同時(shí),網(wǎng)內(nèi)還要傳輸虛擬機(jī)的業(yè)務(wù)數(shù)據(jù),為了更好地支持這三類業(yè)務(wù)數(shù)據(jù)的傳輸,在數(shù)據(jù)中心內(nèi)部將網(wǎng)絡(luò)劃分管理、業(yè)務(wù)、存儲(chǔ)三個(gè)平面,三個(gè)網(wǎng)絡(luò)平面相互隔離,互不影響。
業(yè)務(wù)平面:用來承載用戶端到數(shù)據(jù)中心各個(gè)業(yè)務(wù)應(yīng)用系統(tǒng)的流量以及數(shù)據(jù)中心內(nèi)部云主機(jī)之間的流量,業(yè)務(wù)平面按照業(yè)務(wù)類別的需求進(jìn)一步劃分為不同的業(yè)務(wù)服務(wù)區(qū)。
管理平面:用來承載數(shù)據(jù)中心網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)及安全等設(shè)備之間的管理數(shù)據(jù)、指令操作數(shù)據(jù)以及云計(jì)算系統(tǒng)的維護(hù)和監(jiān)控?cái)?shù)據(jù)。管理平面與業(yè)務(wù)平面共用核心層交換劑,通過VLAN實(shí)現(xiàn)兩個(gè)平面的隔離。
存儲(chǔ)平面:用來承載計(jì)算子系統(tǒng)和存儲(chǔ)子系統(tǒng)之間的存儲(chǔ)流量。存儲(chǔ)平面網(wǎng)絡(luò)是一個(gè)獨(dú)立的隔離網(wǎng)絡(luò),保證存儲(chǔ)網(wǎng)絡(luò)的服務(wù)質(zhì)量和安全。
根據(jù)上述設(shè)計(jì)思路,將數(shù)據(jù)中心網(wǎng)絡(luò)內(nèi)部交換網(wǎng)絡(luò)劃分為核心與接入2個(gè)層次,按照網(wǎng)絡(luò)功能的不同劃分為外聯(lián)區(qū)、網(wǎng)絡(luò)服務(wù)區(qū)、業(yè)務(wù)服務(wù)區(qū)等多個(gè)功能區(qū)。同時(shí),為更好的支持云計(jì)算在數(shù)據(jù)中心的運(yùn)行管理,將網(wǎng)絡(luò)分為管理、存儲(chǔ)、業(yè)務(wù)3個(gè)網(wǎng)絡(luò)平面。
本項(xiàng)目建議的整體網(wǎng)絡(luò)結(jié)構(gòu)可分為:外聯(lián)層、核心網(wǎng)絡(luò)區(qū)、接入網(wǎng)絡(luò)區(qū)、云計(jì)算業(yè)務(wù)區(qū)、管理區(qū)、超算業(yè)務(wù)區(qū),以及存儲(chǔ)區(qū)。
方案優(yōu)點(diǎn):
一個(gè)數(shù)據(jù)中心、支持多種業(yè)務(wù)平臺(tái);
數(shù)據(jù)中心統(tǒng)一運(yùn)維:數(shù)據(jù)中心的設(shè)備進(jìn)行統(tǒng)一管理、統(tǒng)一運(yùn)維;
虛擬化:架構(gòu)開放、先進(jìn),支持高性能CPU/內(nèi)存/存儲(chǔ)/網(wǎng)絡(luò)虛擬化,Qos保證,高安全性和高穩(wěn)定性;
標(biāo)準(zhǔn)化:接口標(biāo)準(zhǔn)化,支持計(jì)費(fèi)、維護(hù)管理、設(shè)備集成、運(yùn)營支撐、能力API;流程標(biāo)準(zhǔn)化,支持IT管理、維護(hù)管理、業(yè)務(wù)管理、安全管理、網(wǎng)絡(luò)管理的標(biāo)準(zhǔn)流程;
自動(dòng)化:支持端到端的自動(dòng)化部署;支持自動(dòng)化管理維護(hù);支持自助運(yùn)營服務(wù);
智能化:支持彈性資源調(diào)度與分配,支持靈活系統(tǒng)與業(yè)務(wù)部署,支持實(shí)時(shí)環(huán)境監(jiān)控與報(bào)警,持動(dòng)態(tài)負(fù)載均衡與節(jié)能;
超算中心:支持多種類型的并行任務(wù)、支持靈活多樣的調(diào)度策略、支持靈活方便的節(jié)點(diǎn)管理、支持自定義的應(yīng)用業(yè)務(wù)流程、提供通用的作業(yè)管理和調(diào)度平臺(tái)、高可用性、高并發(fā)性;
SLA: 創(chuàng)新、智能的服務(wù)建模,可提供面向基礎(chǔ)架構(gòu)、應(yīng)用程序性能管理、工作負(fù)荷、安全、合規(guī)和服務(wù)臺(tái)管理,提供高可靠性SLA;
網(wǎng)絡(luò)設(shè)備:采用數(shù)據(jù)中心級(jí)交換機(jī),保障數(shù)據(jù)中心網(wǎng)絡(luò)高可靠性;
數(shù)據(jù)高可靠性:存儲(chǔ)采用高端NAS集群,支持多節(jié)點(diǎn)負(fù)載均衡,保證存儲(chǔ)高IO、高帶寬,同時(shí)保證業(yè)務(wù)連續(xù)性,高可用性;
高安全性:華為云解決方案采用端管云協(xié)同,從接入側(cè)安全、網(wǎng)絡(luò)安全、云平臺(tái)安全、數(shù)據(jù)安全到管理安全,多層次安全保障設(shè)計(jì),以預(yù)防為主,監(jiān)控與審計(jì)為輔,全方位保障數(shù)據(jù)中心安全;
易于管理:提供方便的UI管理界面,具備較強(qiáng)的自發(fā)現(xiàn)、自部署、自服務(wù)、自管理、自恢復(fù)、自優(yōu)化能力;
可運(yùn)營:云計(jì)算資源可運(yùn)營,提供客戶自助服務(wù)、自助管理;
靈活擴(kuò)展:華為云計(jì)算的系統(tǒng)能力支持超大規(guī)模的用戶容量需求,完全能夠滿足未來云數(shù)據(jù)中心發(fā)展需求。后續(xù)根據(jù)業(yè)務(wù)需要實(shí)現(xiàn)彈性擴(kuò)容、按需擴(kuò)容,不影響已有業(yè)務(wù)的連續(xù)性;
高效的維護(hù)能力:系統(tǒng)支持高效的問題定位能力,縮短問題恢復(fù)時(shí)間;
網(wǎng)絡(luò)平面隔離:在數(shù)據(jù)中心內(nèi)部將網(wǎng)絡(luò)劃分管理、業(yè)務(wù)、存儲(chǔ)三個(gè)平面,三個(gè)網(wǎng)絡(luò)平面相互隔離,互不影響。
網(wǎng)絡(luò)高可靠性:網(wǎng)絡(luò)設(shè)備均采用集群或堆疊,網(wǎng)絡(luò)鏈路全部冗余鏈路或負(fù)荷分擔(dān),存儲(chǔ)采用多路徑方式訪問,保證網(wǎng)絡(luò)鏈路高可用性;
開放性:提供開放的APIs,可供與第三方系統(tǒng)進(jìn)行對(duì)接;
高可交付性:華為具有大規(guī)模批量項(xiàng)目交付經(jīng)驗(yàn),可以幫助企業(yè)快速部署云業(yè)務(wù)、超算以及數(shù)據(jù)中心解決方案;
成本效益與性能:動(dòng)態(tài)計(jì)算能力調(diào)整,可以根據(jù)管理策略對(duì)應(yīng)用進(jìn)行監(jiān)控及伸縮,降低維護(hù)成本,節(jié)能減排;
定制開發(fā):完全自主知識(shí)產(chǎn)品,掌握核心技術(shù),定制開發(fā)能力強(qiáng),可以快速響應(yīng)客戶需求。
拓?fù)湔f明:
外聯(lián)層
外聯(lián)層主要用于數(shù)據(jù)中心與多個(gè)互聯(lián)網(wǎng)運(yùn)營商和專網(wǎng)網(wǎng)絡(luò)互聯(lián),為數(shù)據(jù)中心提供高速的互聯(lián)出口鏈路,實(shí)現(xiàn)數(shù)據(jù)中心與互聯(lián)網(wǎng)及專網(wǎng)之間的互通。出口路由器通過運(yùn)營商鏈路接入多家的運(yùn)營商網(wǎng)絡(luò),以及專網(wǎng)網(wǎng)絡(luò),提高鏈路的可靠性保護(hù)。同時(shí),在該層部署高端防火墻,防火墻建議同時(shí)具備流量清洗功能,可以在數(shù)據(jù)中心遭受到DDoS攻擊時(shí)候提供防護(hù),為數(shù)據(jù)中心整體提供第一層的安全防護(hù)。
核心網(wǎng)絡(luò)區(qū)
核心網(wǎng)絡(luò)層是連接整個(gè)數(shù)據(jù)中心各區(qū)域的橋梁樞紐,承擔(dān)著內(nèi)部數(shù)據(jù)流量和對(duì)外數(shù)據(jù)流量的轉(zhuǎn)發(fā)。
由于本項(xiàng)目為云計(jì)算及超算,則該核心網(wǎng)絡(luò)設(shè)備必須支持IETF標(biāo)準(zhǔn)協(xié)議TRILL(Transparent Interconnection of Lots of Links),支持10GE的核心交換組網(wǎng);構(gòu)建超過500個(gè)節(jié)點(diǎn)的超大規(guī)模二層網(wǎng)絡(luò),支持用戶業(yè)務(wù)靈活部署,支持云計(jì)算虛擬機(jī)大范圍遷移。
由于是大二層網(wǎng)絡(luò)結(jié)構(gòu),該區(qū)域是各個(gè)應(yīng)用業(yè)務(wù)網(wǎng)關(guān)節(jié)點(diǎn),且是各業(yè)務(wù)數(shù)據(jù)內(nèi)部外部的交換節(jié)點(diǎn),該區(qū)域部署安全檢測、分析、防護(hù)設(shè)備有天然優(yōu)勢,對(duì)各業(yè)務(wù)應(yīng)用起到第二層的安全防護(hù)。
運(yùn)維區(qū)
該區(qū)域部署大部分的安全設(shè)備,如遠(yuǎn)程安全接入、漏洞掃描、入侵檢測、審計(jì)系統(tǒng)等,為整網(wǎng)的業(yè)務(wù)提供安全的檢測、分析、防護(hù)與遠(yuǎn)程安全接入功能。
接入網(wǎng)絡(luò)區(qū)
接入網(wǎng)絡(luò)區(qū)提供是為各種設(shè)備提供網(wǎng)絡(luò)接入服務(wù),各種設(shè)備通過接入網(wǎng)絡(luò)設(shè)備提供大量的網(wǎng)絡(luò)接口,進(jìn)行數(shù)據(jù)的通信。接入網(wǎng)絡(luò)設(shè)備與核心網(wǎng)絡(luò)設(shè)備間通過一定收斂比的鏈路進(jìn)行互聯(lián),為計(jì)算、存儲(chǔ)等設(shè)備提供更大范圍的數(shù)據(jù)交換服務(wù)。
云計(jì)算業(yè)務(wù)區(qū)
云計(jì)算業(yè)務(wù)區(qū)采用華為RH2288 V2和RH5885服務(wù)器,該區(qū)域通過FusionSphere云化(虛擬化)技術(shù)進(jìn)行資源池化,形成計(jì)算資源池。
云計(jì)算資源池按需生成的虛擬化主機(jī)。云主機(jī)可象傳統(tǒng)主機(jī)一樣工作,同時(shí)具備更高的彈性資源使用能力、擴(kuò)展能力、遷移能力,具備更靈活配置和快速部署能力。
管理區(qū)
管理區(qū)包括運(yùn)維管理和安全管理兩部分,管理區(qū)的這兩部分通過VLAN進(jìn)行安全隔離,三層互通。
運(yùn)維管理區(qū)主要職責(zé)是對(duì)數(shù)據(jù)中心中包括路由器、交換機(jī)、防火墻、服務(wù)器、存儲(chǔ)、云計(jì)算資源,以及各種應(yīng)用軟件等系統(tǒng)進(jìn)行統(tǒng)一管理與監(jiān)控。運(yùn)維管理區(qū)部署與運(yùn)維管理、監(jiān)控等相關(guān)的服務(wù)器、控制主機(jī)、運(yùn)維客戶端等運(yùn)維設(shè)備,以及ManageOne統(tǒng)一運(yùn)營運(yùn)維管理軟件; 連接操作、管理數(shù)據(jù)中心內(nèi)部所有主機(jī)、服務(wù)器、網(wǎng)絡(luò)設(shè)備、存儲(chǔ)設(shè)備等控制臺(tái)、監(jiān)控機(jī)等。
安全管理區(qū)主要職責(zé)是對(duì)數(shù)據(jù)中心內(nèi)部的網(wǎng)絡(luò)、主機(jī)、系統(tǒng)、云計(jì)算資源和應(yīng)用等設(shè)施進(jìn)行統(tǒng)一管理與監(jiān)控。安全管理區(qū)部署安全管理系統(tǒng)的服務(wù)器和系統(tǒng),如補(bǔ)丁分發(fā)系統(tǒng)、網(wǎng)絡(luò)防病毒系統(tǒng)、網(wǎng)頁防篡改系統(tǒng)、主機(jī)防護(hù)系統(tǒng),以及安全設(shè)備的監(jiān)控臺(tái)等。實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)、安全、設(shè)備、系統(tǒng)、應(yīng)用、數(shù)據(jù)等的管理維護(hù)。
超算區(qū)(暫不建設(shè))
以物理基礎(chǔ)設(shè)施的方式為超算服務(wù)平臺(tái)提供計(jì)算資源,采用多個(gè)10GE光纖到CE12800核心交換區(qū),管理納入到數(shù)據(jù)中統(tǒng)一管理平臺(tái)ManageOne。
存儲(chǔ)區(qū)
數(shù)據(jù)中心的存儲(chǔ)資源主要包括DSware分布式存儲(chǔ)資源池和NAS存儲(chǔ)。DSware分布式存儲(chǔ)資源池、NAS存儲(chǔ)主要為數(shù)據(jù)中心內(nèi)部的業(yè)務(wù)應(yīng)用以及數(shù)據(jù)備份提供存儲(chǔ)資源。
DSware分布式存儲(chǔ)資源池使用數(shù)據(jù)中心內(nèi)部的存儲(chǔ)網(wǎng)絡(luò)平面?zhèn)魉痛鎯?chǔ)數(shù)據(jù),網(wǎng)絡(luò)的存儲(chǔ)平面與業(yè)務(wù)平面物理隔離,保證存儲(chǔ)數(shù)據(jù)傳送的質(zhì)量。NAS存儲(chǔ)使用數(shù)據(jù)中心內(nèi)部的業(yè)務(wù)平面網(wǎng)絡(luò)傳送存儲(chǔ)數(shù)據(jù),通過CIFS、NFS標(biāo)準(zhǔn)協(xié)議向數(shù)據(jù)中心內(nèi)部服務(wù)器提供存儲(chǔ)資源。
三、 客戶價(jià)值
某大學(xué)超算云計(jì)算中心的的建成將對(duì)遼沈地區(qū)科技基礎(chǔ)設(shè)施建設(shè)、戰(zhàn)略新興產(chǎn)業(yè)培育、高科技產(chǎn)業(yè)集群發(fā)展發(fā)揮帶動(dòng)、引領(lǐng)作用,為沈陽市建設(shè)“兩化融合” 實(shí)驗(yàn)區(qū)、走以信息化帶動(dòng)工業(yè)化的新型工業(yè)化道路作出貢獻(xiàn)。