文心一言算力從哪來?自家最大智算中心:算力規模4EFLOPS

百度版ChatGPT底層算力支持,李彥宏老家 陽泉助一臂之力!

量子位獲悉, 百度陽泉智算中心從2月底開始就布設了 兩個新機房,專門為自家大模型產品 文心一言提供計算推理的算力需求。
同樣功能的機房,在百度保定計算集群, 還有兩個。
北京、華南的云計算資源也會為文心一言提供支持。
其中,陽泉智算中心是亞洲單體最大的智算中心,算力規模可達 4EFLOPS(每秒400億億次浮點計算)。
而就在最近,微軟也表示為ChatGPT專門打造了超算集群,由 上萬塊英偉達A100組成,并專門為此調整了伺服器架構。
那麼百度的算力基礎設施水平如何?
量子位剛剛從陽泉智算中心探訪歸來,給大家來波揭秘~
每秒400億億次浮點計算據百度介紹,陽泉智算中心在3月份剛剛完成升級。
它是目前亞洲最大單體智算中心,算力規模達 4EFLOPS(每秒400億億次浮點計算),整個建筑面積約12萬平方公尺。
一共包括13個模組,可承載約 28萬台伺服器。

智算中心采用 CPU+GPU+XPU三種計算架構。
其中XPU應該主要指百度自家的 崑崙芯,其產品一代二代均已實現量產,落地規模在2萬片以上。
計算能力上,基于天蝎機柜伺服器、「冰山」冷存儲伺服器和X-MAN超級AI計算平台等,可支持 10G、25G的通用計算網絡接入和 100G的AI高速無損網絡的交換機。
每秒可完成 2000萬億次深度神經網絡計算。
節能低碳方面,陽泉智算中心 PUE可以低至1.08。(這一數值大于1、越接近1表示能效水平越好)
在供電上,陽泉智算中心去除了傳統的UPS(不間斷電源),采用HVDC offline(高壓直流離線)技術、分布式鋰電池(BBS)供電技術,把供電效率從90%提升到 99.5%。
同時采用太陽能光伏發電(陽泉日照比較充足),在頂樓鋪設太陽能光伏面板,直接并網發電給伺服器使用。
散熱方面,由于陽泉年平均氣溫在8-12度,晝夜溫差大,智算中心可以直接利用當地氣候條件散熱。
據介紹,全年96%的時間可以使用室外冷空氣實現免費冷卻,換算過來一年里有14.6天才需要全部開冷水機組制冷,從而節省了大量的能源。
技術人員表示,智算中心會按需發電和散熱,日常運維也是基于AI來實現的。

自21年4月以來,陽泉智算中心正式投入使用。在去年12月起,開始對外開放服務。
當時項目計劃投資為47.08億元。
目前,陽泉智算中心可以支持各種AI應用場景,如語音識別、圖像處理、自然語言處理和機器學習。為百度搜索、社區、推廣服務等提供算力支撐。
云計算要借大模型的東風無獨有偶,微軟也在近日公開了為ChatGPT專門打造的超算集群,包含了 上萬張英偉達A100。
微軟表示,他們給OpenAI提供這台超算已經有3年之久,而ChatGPT也正是基于這台超算提供的算力訓練的。
此舉背后,微軟有兩方面考量。
其一,吸引更多企業來使用Azure訓練自己的大模型。微軟執行副總裁Scott Guthrie表示:
雖然它是OpenAI的定制版,但同樣具備某種通用性,任何企業都可以基于這種方式來訓練自己的大語言模型。
其二,直接在Azure中提供OpenAI模型服務(Azure OpenAI Service)。
此前包括GPT-3、Codex和DALL·E 2等模型,都已經接入Azure。
至于納德拉1月份立的「要把ChatGPT加入Azure服務」flag,目前也已經實現。

類比來看,百度想打的算盤,或許也不會局限在文心一言本身。
據介紹,為了支持文心一言的大規模智能算力需求, 百度智能云已經完成了三大配套云服務。
3月份升級陽泉智算中心; 2月,百度智能云升級了AI研發運營一體化(MLOps)能力; 去年12月,百度發布了全棧自研的AI基礎設施「AI大底座」(陽泉智算中心搭載了這一底座)。
前段時間李彥宏內部信中還提到:
文心一言將通過百度智能云對外界提供服務,根本性地改變 云計算市場的游戲規則。
這里的意思是,大模型浪潮將改變傳統云計算服務看 算力、存儲的舊習慣,而是進入到看框架好不好、模型好不好,以及模型、框架、芯片、應用之間的協同的新游戲規則。
由此也可推理,百度寄希望于文心一言,向市場驗證自家云計算能力,并吸引更多企業用戶。
據介紹,百度搭建的「AI大底座」包括了百舸異構計算平台和AI中台兩大部分。
百舸異構計算平台可以在AI計算、存儲、加速、容器方面進行系統優化,承載數據處理、超大模型的推理和訓練。
AI中台整合了飛槳深度學習框架和百度文心大模型,實現了從數據存儲到模型訓練、生產、部署、測試的全鏈路、批量化生產。
而百度智能云更具體的能力如何?
或許從文心一言上線后的表現就能略知一二了。
— 完 —


[圖擷取自網路,如有疑問請私訊]

本篇
不想錯過? 請追蹤FB專頁!    
前一頁 後一頁