8月7日,2025開放計算技術(shù)大會(OCTS25)在京舉行,浪潮信息作為OCTC創(chuàng)始成員和OCP核心成員受邀參會,重磅發(fā)布超節(jié)點AI服務(wù)器“元腦SD200”,單機即可運行超萬億參數(shù)大模型,并在多個全參模型實測中,實現(xiàn)64卡整機推理性能的超線性擴展;同時面對未來高功率、高密度算力場景的散熱難題,浪潮信息推出MW級泵驅(qū)兩相液冷AI整機柜方案,單芯片解熱突破3000W,解熱能力高達每平方厘米250w以上。
開源開放聚焦系統(tǒng)創(chuàng)新,加速AI創(chuàng)新與普惠
當(dāng)前,模型算法開源、算力系統(tǒng)開放,已經(jīng)成為AI時代的主流趨勢。開源大模型大幅降低了獲取、部署和定制AI能力的門檻,推動“智能平權(quán)”的實現(xiàn)。而公共云平臺和模塊化AI基礎(chǔ)設(shè)施的普及,則為開源模型的規(guī)模化落地和應(yīng)用創(chuàng)新提供了至關(guān)重要的開放算力基礎(chǔ)。二者相輔相成,進一步加速AI普惠的實現(xiàn)。
在這一趨勢下,算法和算力、硬件和軟件的協(xié)同創(chuàng)新變得日趨重要,系統(tǒng)化思維已經(jīng)成為產(chǎn)業(yè)共識。浪潮信息副總經(jīng)理趙帥表示,開源開放的AI發(fā)展趨勢下,開放計算所構(gòu)建的全球化協(xié)作平臺將發(fā)揮更加重要的作用。開放計算社區(qū)的核心目標(biāo)就是利用生態(tài)力量打破性能瓶頸,推動業(yè)務(wù)創(chuàng)新發(fā)展,本質(zhì)上就是一種系統(tǒng)化思維與應(yīng)用價值導(dǎo)向。特別是隨著混合專家模型(MoE)的快速迭代與多智能體協(xié)同的興起,算力形態(tài)向高密、高 效、綠色發(fā)展,數(shù)據(jù)中心規(guī)模日益擴張并追求極 致算效和能效,產(chǎn)業(yè)將從“機柜級密度革命”邁向“數(shù)據(jù)中心級系統(tǒng)工程挑戰(zhàn)”,更需要全球產(chǎn)業(yè)鏈開放協(xié)同,以系統(tǒng)化思維共同應(yīng)對挑戰(zhàn)。
面向萬億參數(shù)大模型,重磅發(fā)布超節(jié)點AI服務(wù)器“元腦SD200”
當(dāng)前,混合專家模型(MoE) 的高 效架構(gòu)正在驅(qū)動大模型參數(shù)規(guī)模持續(xù)擴展,國內(nèi)外前沿大模型的參數(shù)量快速突破萬億規(guī)模,這給算力系統(tǒng)架構(gòu)提出新的挑戰(zhàn),需要具備超大顯存空間、更低通信時延、更強計算性能。
為此,浪潮信息發(fā)布面向萬億參數(shù)大模型的超節(jié)點AI服務(wù)器“元腦SD200”,創(chuàng)新研發(fā)多主機低延遲內(nèi)存語義通信架構(gòu),基于開放總線交換技術(shù)構(gòu)建,在單機內(nèi)實現(xiàn)了64路GPU芯片的高速統(tǒng)一互連,成功解決萬億大模型對超大顯存空間和超低通信時延的核心需求。在開放架構(gòu)之上,元腦SD200通過智能總線管理和開放的預(yù)填充-解碼(Prefill-Decoder)分離推理框架實現(xiàn)軟硬件深度協(xié)同,智能化管理復(fù)雜AI計算任務(wù)。
元腦SD200超節(jié)點AI服務(wù)器通過軟硬協(xié)同系統(tǒng)創(chuàng)新,成功向上擴展突破芯片性能邊界,在大模型場景中展示出的性能表現(xiàn)。結(jié)合優(yōu)化的PD分離框架,SD200超節(jié)點滿機運行DeepSeek R1全參模型推理性能超線性提升比為3.7倍,滿機運行Kimi K2全參模型推理性能超線性提升比為1.7倍。
趙帥強調(diào),超節(jié)點架構(gòu)的核心價值在于軟硬件高度協(xié)同,本質(zhì)上也是系統(tǒng)化思維的產(chǎn)物。它不是某一個點的突破,而是在現(xiàn)有技術(shù)、生態(tài)和成本約束下,從系統(tǒng)層面去打破芯片本身的性能邊界,至大化用戶價值。作為社區(qū)的一員,浪潮信息后續(xù)將向社區(qū)成員開放自研的超節(jié)點架構(gòu)設(shè)計以及PD分離框架,推動開放超節(jié)點架構(gòu)的發(fā)展。
推出前瞻MW級泵驅(qū)兩相液冷AI整機柜方案 實現(xiàn)四大關(guān)鍵技術(shù)突破
算力的高密發(fā)展趨勢,使得單機柜功率將從當(dāng)前的100+kW躍升至未來的1MW以上,對液冷解熱能力提出更高要求。隨著芯片功耗、單機柜功率密度的持續(xù)攀升,單相冷板液冷解熱必須提供更低的二次側(cè)供液溫度,自然冷卻方式受到更多限制甚至無法繼續(xù)使用,導(dǎo)致數(shù)據(jù)中心能耗問題加劇,逐漸難以滿足散熱需求。
針對于此,浪潮信息在會上推出了前瞻的MW級泵驅(qū)兩相液冷AI整機柜方案,采用高 效相變散熱技術(shù),單芯片解熱突破3000W,解熱能力高達每平方厘米250w以上。該方案還提升了液冷系統(tǒng)的安全可靠性,兩相冷媒絕緣且無腐蝕性,規(guī)避了電氣短路風(fēng)險,保障IT設(shè)備安全運行,同時可杜絕微生物滋生,無需定期水質(zhì)檢測,大大提升運維便捷性,減少部件的老化和故障概率,提高系統(tǒng)可靠性并降低成本。
浪潮信息MW級泵驅(qū)兩相液冷AI整機柜方案實現(xiàn)了四項關(guān)鍵技術(shù)突破,一是攻克相變液冷系統(tǒng)中相變溫度,壓力調(diào)控的核心瓶頸,自研瞬態(tài)熱-壓-流多參數(shù)協(xié)同技術(shù),消除系統(tǒng)中氣蝕隱患;二是針對多應(yīng)用并存和多芯片并行帶來的負載跳變時流量易失衡,芯片易超溫的難題,成功開發(fā)出節(jié)流調(diào)控模塊及主動式壓降約束技術(shù),在200顆芯片同時并行負載跳變工況下,實現(xiàn)流量分配偏差小于10%,溫差小于2℃;三是創(chuàng)新的冷板微納尺度仿生拓撲構(gòu)形與復(fù)合制程設(shè)計,大幅提升兩相冷板解熱性能;四是專屬配方的綠色環(huán)保低壓冷媒獲得商用驗證,0泄漏風(fēng)險的同時,系統(tǒng)運行工作壓力低于1MPa,與單相液冷深度趨同。
浪潮信息同時發(fā)布算力密度更高的超節(jié)點AI服務(wù)器與MW級泵驅(qū)兩相液冷AI整機柜方案,不僅可以滿足當(dāng)下MoE大模型對算力系統(tǒng)的需求,更是前瞻布局未來的GW級AI數(shù)據(jù)中心。目前,浪潮信息積極參與"GW級開放智算中心OCP中國社區(qū)小組"成立的籌備工作,OCP與OCTC積極合作,探討將OCP的AI基礎(chǔ)設(shè)施技術(shù)架構(gòu)、參考方案、研究成果等在中國市場落地,在中國建立GW級AI數(shù)據(jù)中心的全球性標(biāo)桿。
趙帥表示,萬億參數(shù)大模型帶來的系統(tǒng)架構(gòu)變革、MW級機柜的密度革命、GW級數(shù)據(jù)中心的工程挑戰(zhàn)……人工智能為數(shù)據(jù)中心產(chǎn)業(yè)帶來的不僅僅是技術(shù)的演進,更是結(jié)構(gòu)性的變革,需要以更加開放的理念構(gòu)建更加開放的生態(tài),通過開放的人工智能基礎(chǔ)設(shè)施來實現(xiàn)算力普惠、加速智能平權(quán)。