Copyright 2017-2025 北方報 版權所有 京ICP備16071829-1號
芯片問題其實沒必要擔心,用疊加和集群等方法,計算結(jié)果上與最先進水平是相當?shù)摹?rdquo;近期,華為總裁任正非的一次公開發(fā)聲,增強了社會各界對中國AI發(fā)展的信心。
我們都知道,中國已經(jīng)形成了“百模千態(tài)”的大模型產(chǎn)業(yè),有多個大模型走在全球前列。但無論AI產(chǎn)業(yè)如何發(fā)展,算力都是驅(qū)動模型演進的根本動力。隨著外部技術封鎖步步緊逼,國產(chǎn)算力能否擔當大用?是否只能做推理而不能做復雜訓練?很多人其實心里沒底。
“我們單芯片還是落后美國一代,我們用數(shù)學補物理,非摩爾補摩爾,用群計算補單芯片,在結(jié)果上也能達到實用狀況。”任正非的公開發(fā)聲,給國內(nèi)AI產(chǎn)業(yè)吃下了一顆“定心丸”。
帶著對國產(chǎn)算力發(fā)展的關心,觀察者網(wǎng)與華為2012實驗室的技術專家的做了一次交流,我們了解到,昇騰算力不僅實現(xiàn)推理性能全球領先,同時系統(tǒng)穩(wěn)定性也保持在高水平,能高效訓出世界一流的萬億參數(shù)大模型。尤其是CloudMatrix 384超節(jié)點技術,以系統(tǒng)補單點,從堆芯片到拼架構,核心指標比肩英偉達,成為中國AI發(fā)展的堅實算力底座。
芯片問題為何不用擔心?
在外部制裁圍堵下,芯片問題就像“達摩克里斯之劍”一樣,一直懸在中國產(chǎn)業(yè)界頭上。尤其隨著中美AI競爭愈發(fā)激烈,美國一方面竭力遏制中國先進芯片制造的能力,另一方面又不斷收緊對英偉達高端芯片的出口管制,試圖讓中國AI產(chǎn)業(yè)在“算力囚籠”中止步不前。
但危中也有機。行業(yè)的發(fā)展趨勢是,當Transformer這樣的大型神經(jīng)網(wǎng)絡模型橫空出世,萬億參數(shù)模型開始涌現(xiàn),對算力和顯存的需求呈爆炸式增長,單個GPU甚至單個服務器都難以招架,集群算力成為大勢所趨,這也給中國用系統(tǒng)方法解決算力困境帶來契機。
說起“系統(tǒng)論”,老一輩中國人可能并不陌生。錢學森的《論系統(tǒng)工程》,核心思想就是把研究對象看做一個整體而不是孤立的點,通過整體優(yōu)化彌補單點落后。
華為制裁中突圍,正是受到系統(tǒng)工程的啟發(fā)。技術專家對觀察者網(wǎng)表示,算力基礎設施是復雜的系統(tǒng),華為把各個部分打通了,在內(nèi)部組織了算力會戰(zhàn),把華為云、模型、底座、芯片、硬件工程、基礎軟件的研發(fā)力量集結(jié)在一起,跨部門作戰(zhàn),深度協(xié)同。這樣的環(huán)境和機制,能夠產(chǎn)生協(xié)同效應和系統(tǒng)工程的整合,實現(xiàn)了“大雜燴”技術的有效利用和協(xié)同創(chuàng)新。
基于系統(tǒng)工程,華為構建了巨型算力基礎設施CloudMatrix 384超節(jié)點,通過全對等高速互聯(lián)架構,讓384張昇騰卡可以像一臺計算機一樣工作。它的算力總規(guī)模達300Pflops,是英偉達旗艦NVL72的1.7倍;網(wǎng)絡互聯(lián)總帶寬達269TB/s,比英偉達NVL72提升107%;內(nèi)存總帶寬達1229TB/s,比英偉達NVL72提升113%。更關鍵的是,它還能擴展為包含數(shù)萬卡的Atlas 900 SuperCluster超節(jié)點集群,未來可以支撐更大規(guī)模的模型演進。