1、市場規??焖僭鲩L
ToB/C大模型應用加速落地,多模態大模型快速演進,進一步帶動智算產業強勁發展。
2023年,ChatGPT等大語言模型已然引發“搶芯大戰”,AI催生算力需求爆發增長。2024年,隨大模型加速向垂直行業和領域滲透、GPT Store等助推AI原生應用落地、以及多模態模型快速發展,智算市場將繼續保持高增長態勢。海外市場,FactSet和彭博預測2024年北美三大頭部云商(AWS、微軟和谷歌)的云業務營收、云基礎設施投資增長將達到22.5%、16.6%,相比2023年均小幅提升,整體較為樂觀。我國市場,參照工信部等六部門聯合印發的《算力基礎設施高質量發展行動計劃》發展目標,2023-2025年我國算力規模復合增長率為18.5%,2024年新增算力規模將接近40EFLOPS,算力核心產業規模有望突破2.4萬億元。
2、產業新格局加速形成
AI算力促進IDC和云服務升級,助推“三三一”算力服務產業新格局。
2023年,擁有大量GPU資源,專門從事算力建設到租賃解決方案業務的第三方算力租賃商成為算力服務市場新勢力并引得資本青睞與關注。中貝通信、真視通、蓮花健康等算力租賃上市公司的股價(截至2023年12月27日)均達到100%甚至200%以上增長。2024年,IDC服務提供商、云服務提供商、第三方算力租賃商將成為算力市場的“三大運營主體”,瓜分整體算力服務市場,并提供算力租賃、算力+平臺服務、算力+平臺+模型服務的“三類算力服務模式”,特別第三方算力租賃模式有望復現第三方IDC服務商高速增長路徑,在優質客戶合作驅動下利用自身渠道和資源整合能力,打造“客戶-資金-AI算力”閉環擴張。同時,算力共享聯盟模式將逐步顯現,如多個初創公司共同開展GPU算力購買和共享使用,降低算力整體使用成本。產業市場將形成“三大運營主體”、“三類算力服務模式”以及“一種新型算力共購共享聯盟”的“三三一”產業格局。
3、規?;s化建設凸顯
大模型量級突破,驅動智算集群化,E級以上大型智算中心成主流。
大模型參數規模的跨量級突破,數據集倍數增長,亟需海量算力承載,助推AI服務器性能的持續提升,智算布局呈現規?;?、集群化趨勢明顯。一是單個服務器性能的提升可有效降低服務器間參數、數據量等傳輸時延,提升計算效率,預計2024年下半年將推出超越現有H系列的高性能GPU卡。二是依托高性能GPU卡搭建超級計算機(服務器集群),E級規模智算集群將成為主流。根據賽迪報告預測,到2024年年底我國將有5%—8%的企業大模型參數從千億級躍升至萬億級,算力需求增速將達到320%。谷歌、微軟等相繼推出的大模型參數量向千億、萬億級規模演進,著力打造面向大模型訓練的E級智算集群。據公開統計我國建成的超E級智算中心僅5家,預計2024年超大規模智能中心占比穩步提升。
4、算力布局向縱深拓展
AI大模型向邊緣和終端延伸,智算基礎設施加速向城市和邊緣滲透。
多模態大模型和算力底層技術不斷完善,大模型部署在邊緣側與移動端成必然趨勢,面向城市、邊緣的智算中心布局態勢將愈加明顯。一方面AI大模型擴張帶來推理算力需求激增,驅動分布式推理算力中心下沉,本地或靠近部署算力可有效緩解成本壓力。另一方面AI大模型逐漸向智能汽車、電腦、手機等邊緣端下沉,融入終端等智能體,邊緣算力可有效滿足低時延AI應用的快速響應要求。繼成都、北京、上海、深圳等城市之后,2024年將有更多城市推出針對算力高質量發展的政策文件,統籌城市級和行業類智算資源需求,提速城市算力基礎設施升級。
5、云智和訓推一體化
一體化成為智算主流服務模式,實現算力、算法和數據的高效協同。
以數據為主線,云計算為基礎的一體化智算服務將成主流,實現算力、數據和算法的高效協同,滿足智算應用場景的數據處理、存儲、傳輸等環節要求。加大AI與云計算融合發展已成頭部云商共識,AWS與英偉達開展AI基礎設施、加速庫、基礎模型等全棧合作,旨在將AWS打造成為運行GPU的最佳云端環境;阿里云近日陸續推出大模型一鍵部署至數據庫與函數計算等功能,以優化云上AI開發流程;百度將靈境矩陣平臺升級為智能體平臺,從關注模型層轉戰到重視生態、應用培育。2024年關注重點聚焦在“AI+云+數據”的全棧式一體化服務,ICT開發范式與產業生態將進一步被重構。云主機、存儲、數據庫等一系列產品將面向AI全面升級,數據處理、訓練、微調、推理等模型使用全流程將傾向于在同一服務環境中實現。
6、泛在算力網絡加速
算力組網新技術蓬勃發展,算力中心互聯和內部網絡亟需突破帶寬瓶頸。
近日國家發改委等五部門聯合印發《深入實施“東數西算”工程 加快構建全國一體化算力網的實施意見》,明確打造層級化網絡時延圈,滿足差異化城市-區域-國家的多級算力服務體系,為算力組網提供了指導。2024年,算力中心互聯組網方面,隨著新一代高性能芯片的發布,算力互聯持續催生800G及1.6T需求,遠距RDMA、百P級全光互聯、新型光纖等關鍵技術將進一步突破,算力互聯的低時延、確定性保障持續改善。算力中心內部組網方面,無阻塞、高吞吐量是承接大模型訓練的核心訴求,將催生RoCEv2相關算法更加成熟。
7、公共算力統一調度
算力普惠服務持續突破,區域級、城市級服務平臺初現。
以政府、運營商、云商等為運營主體的算力一體化調度平臺、算力互聯互通平臺正在建設與試點運營,支撐算、網、云融合調度與一體化發展,實現從“任務找算力”到“算力適配任務”的轉變,有效解決算力資源分散、主體多、供需匹配失衡和使用成本高等問題。2024年公共算力統一調度服務將呈現新的變化,一是依托IXP的公共算力平臺將成為主要形態,附加算力調度、供需對接等將加速試點應用;另一方面圍繞樞紐節點的算力生態聚集效應進一步加強,區域級、城市級等公共算力服務平臺初步顯現,并形成具有行業影響力的聯合運營體。
8、多元化和國產化提速
芯片類型、架構和供給呈多元化趨勢,國產芯片自主生態加快建設。
新技術廣泛應用與全球算力短缺的背景下,芯片類型、架構和提供商方面均呈現多元化趨勢,芯片自主可控能力將進一步提升。芯片類型方面,5G、人工智能、自動駕駛等新興技術產業化加速,產業及政策關注從以CPU為主,向高性能計算芯片、存儲芯片等拓展;芯片架構方面,RISC-V以其優秀的靈活性及擴展性,突破以x86與ARM架構主導的產業格局,業界已成功探索RISC-V在AI領域應用;芯片廠商方面,主流云商均著手自研芯片,通過軟硬協同制衡英特爾、英偉達等壟斷,華為、中芯國際、長鑫等多家國內廠商近期均有突破。2024年關注重點聚焦在國產化芯片的生態體系建設,包括芯片設計、制造、封裝等全流程及相關軟件、系統、框架等關鍵環節。
9、傳統DC向AIDC演進
AI算力引領數據中心加快綠色化、模塊化和運維智能化發展。
數據中心正在向智算中心快速演進,液冷制冷引入、模塊化建設、智能化運維等將顯著上升。一是液冷制冷應用將從局部試點狀態逐步轉向爬坡期,單機柜功率密度達到20KW時液冷與風冷投資成本已基本持平,2024年液冷應用將加快普及,2025年國內運營商50%以上數據中心項目將覆蓋。二是智算中心靈活適配、快速交付等工程實施能力增強,圍繞制冷、供電、智能化系統的模塊化設計、標準化封裝,產業聯合創新和系統解決方案將更加豐富。三是數據中心智能化運維水平有望上新臺階,特別是運用AI等技術手段,充分發揮電源空調設備自動化、智能化優勢,實現運行能耗的精準管控和智慧運營。
來源:天翼智庫