當前,火熱的大模型技術和面向行業(yè)場景化的創(chuàng)新AI研發(fā),都離不開算力資源的有力支撐。進入大模型時代,算力需求日益復雜,不僅要求算力資源更加充沛和靈活,還要求算力基礎設施向智能化和一體化的方向發(fā)展,以更高效率和性能來支持更大規(guī)模計算。
如何解決智算資源供給矛盾?如何提高算力利用效率?如何讓“計算”更綠色低碳?中國電信天翼云給出了答案。
今天,一起走進中國電信京津冀智能算力中心萬卡池,看中國電信天翼云如何擁抱人工智能技術趨勢,通過豐富的智算資源供給和一體化的平臺服務能力,助力千行百業(yè)向智發(fā)展,為數(shù)字經濟發(fā)展注入新動能。
“智能計算”夯實算力底座
走進中國電信京津冀智能算力中心,十幾棟黑白相間的建筑整齊排列,機房、冷卻車間、應急發(fā)電設備分布其中。來到機房里,一排排機柜鱗次櫛比,五顏六色的數(shù)據(jù)線整齊有序,信號燈不斷閃爍……大量數(shù)據(jù)信息在這里傳遞、計算和存儲。
適應人工智能發(fā)展趨勢,中國電信規(guī)劃并建設全國“2+3+7+X”公共智算資源池,在京津冀、長三角地區(qū)建設兩大國產液冷單集群萬卡智算池。“中國電信京津冀智能算力中心是業(yè)內領先的全國產化訓推一體、基于自研架構的液冷高性能公共智算中心,可以承載千億到萬億參數(shù)的大模型訓練業(yè)務。”中國電信京津冀智能算力中心副主任專家趙夢麟介紹。
京津冀智能算力中心依托中國電信“2(2)+4+31+X+O”梯次化云資源布局、空天一體的衛(wèi)星網絡、全球最大的全光算力網絡,具備以京津冀為中心、全國可達的超低時延圈網絡優(yōu)勢,北京、天津算力用戶可1ms“一跳入算”接入京津冀智算中心,滿足多場景下科研創(chuàng)新算力和大模型訓練所需的高并發(fā)算力需求。中國電信京津冀智能算力中心重點滿足京津冀及周邊省份的智算業(yè)務發(fā)展需求,將服務AI大模型、車聯(lián)網、互聯(lián)網、生物醫(yī)藥等高新企業(yè),并為政府、企業(yè)、高校等提供公共算力、應用創(chuàng)新孵化、產業(yè)聚合發(fā)展、科研創(chuàng)新和人才培養(yǎng)等平臺服務。
緊隨人工智能、大模型等產業(yè)發(fā)展方向,中國電信京津冀智能算力中心持續(xù)提升智能算力承載能力,建設了國產自主智能算力萬卡資源池,滿足萬億參數(shù)大模型預訓練部署要求。“這個萬卡資源池是京津冀地區(qū)目前唯一的擁有萬卡國產芯片的智能算力中心,能夠為整個京津冀地區(qū)的大模型客戶提供充沛的算力供給。”趙夢麟介紹。
據(jù)了解,萬卡資源池依托天翼云自主研發(fā)的“息壤”一體化智算服務平臺,實現(xiàn)萬卡資源納管和萬卡規(guī)模并行訓練。“息壤”能夠提供單集群萬卡國產化全功能預訓練服務,采用自適應并行策略,多項技術突破實現(xiàn)萬卡長效穩(wěn)定訓練,MFU達到國內領先水平,能夠滿足各種算力應用場景及各種不同客戶的算力需求,適用于千億/萬億級參數(shù)規(guī)模大語言模型訓練,如Llama 3、Qwen等超大規(guī)模語言模型,以及多模態(tài)模型開發(fā)、虛擬現(xiàn)實與元宇宙等。
萬卡資源池將為廣大企業(yè)提供高效、穩(wěn)定、安全的一站式智算服務,支持企業(yè)數(shù)字化轉型和智能化升級。國產算力資源將賦能智慧城市建設、公共服務優(yōu)化等應用場景,提高政府治理能力和公共服務水平。
未來,根據(jù)業(yè)務發(fā)展需要,中國電信京津冀智算能力中心將持續(xù)提升一體化智算服務平臺整體效能,不斷培育完善國產化智算生態(tài)系統(tǒng),賦能更多行業(yè)、企業(yè),助力實體經濟與數(shù)字經濟深度融合。
“綠色計算”助力可持續(xù)發(fā)展
數(shù)據(jù)中心是耗能大戶,也是節(jié)能降碳的核心發(fā)力領域之一。據(jù)國網能源研究院預測,到2030年,我國數(shù)據(jù)中心用電量會突破4000億千瓦時,占全社會用電量的比重達3.7%。為了解決數(shù)據(jù)中心高能耗以及算力需求激增的矛盾,“綠色計算”是大勢所趨。
作為京津冀地區(qū)最大的綠色算力中心,中國電信京津冀智能算力中心在探索綠色發(fā)展模式的過程中做了哪些努力呢?
走進京津冀智能算力中心的冷站,首先映入眼簾的是色彩分明的供水管路。通過這些黃色、綠色、紅色、藍色的管道,空調用水實現(xiàn)了高效循環(huán),服務器運行過程中產生的熱量通過精心設計的水冷系統(tǒng)得到釋放,從而保障服務器平穩(wěn)運轉。
“滿足高密度、高功率的智算服務器的供冷需求,是智能算力中心建設過程中的一個難點。”來到智能算力彈性方艙,趙夢麟介紹了目前天翼云萬卡資源池所采用的冷板式液冷技術。冷板式液冷是通過冷板(通常為銅鋁等導熱金屬構成的封閉腔體)將發(fā)熱器件的熱量間接傳遞給封閉在循環(huán)管路中的冷卻液體,通過冷卻液體將熱量帶走的一種實現(xiàn)形式,它可以精準定位CPU、GPU的發(fā)熱點進行冷卻,實現(xiàn)高效散熱。冷板式液冷通過冷卻塔進行換熱,能夠冷卻70%~80%的服務器發(fā)熱量,剩余20%~30%的發(fā)熱量通過冷凍水補冷方式冷卻。由于液冷系統(tǒng)不需要使用風扇等機械設備進行散熱,因此能夠顯著降低噪聲,并減少服務器的能耗,有助于實現(xiàn)數(shù)據(jù)中心的綠色轉型,降低運營成本。
“冷板式液冷技術的應用不僅提升了算力規(guī)模,還提高了算力服務的質量。通過降低服務器的運行溫度和散熱噪聲,改善了算力中心的工作環(huán)境,提高了工作人員的舒適度和工作效率。”趙夢麟介紹,根據(jù)估算,采用冷板式液冷技術,年節(jié)約用電量可達億千瓦時,減少的二氧化碳排放量也相當可觀。“經計算,采用冷板式液冷技術的萬卡資源池全年PUE值為1.15,單位算力能耗為1.5kW/P。”
智能的算力,綠色的算力。面向云智融合的時代趨勢,作為云服務國家隊的天翼云勇?lián)鷷r代重任,打造多層次的算力布局,將通過豐富的智算資源供給,充分發(fā)揮“息壤”一體化智算服務平臺作用,提供綠色、高效的智算服務,持續(xù)為全社會的智能化轉型升級增添動能。
中國電信京津冀智能算力中心。
中國電信京津冀智能算力中心萬卡池機房。
中國電信京津冀智能算力中心冷站。