2024-11-15 01:32:42 1
快科技11月14日訊息,NVIDIA Blackwell GPU相當強悍,大家都知道,但到底有多強呢?
除了官方宣傳資料,現在終於第一次看到了實測資料,來自MLCommons MLPerf v4.1,考察AI訓練推理效能的最佳平臺。
對比物件是兩代伺服器HGX B200、HGX H200,前者包含多達八顆Blackwell GPU B200,單顆功耗高達1000W。
GPT-3預訓練專案中,Blackwell的效能相比上代Hopper翻了一番。
Llama 2 700億引數微調專案中,Blackwell的效能更是提升了多達2.2倍。
值得一提的是,Blackwell平臺具備ConnectX-7 SuperNICs網絡卡、Quantum-2 InfiniBand交換機,再加上第五代NVLink互連匯流排,可以充分保障節點間的通訊,可以平衡分配AI訓練負載,整體效率更高。
比如同樣的GPT-3 1750億引數效能,Hopper需要多達256顆GPU,Blackwell就只需要64顆。
本站內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容,請發送郵件至舉報,壹經查實,本站將立刻刪除。