您好,歡迎到訪!

GPU計算爆發!誰還記得遊戲顯示卡鼻祖GeForce 256?

2024-10-14 01:34:38 5

GPU計算驅動AI。

2024 年 8 月,國產遊戲《黑神話:悟空》正式開售。作為近期熱度最高的國產遊戲,《黑神話》憑藉出色的劇情發展、場景設計和配樂成功“出圈”,不僅遊戲愛好者們“人手一份”,不少已經“戒遊戲”的老玩家也選擇趁機升級電腦,換張新顯示卡好好享受遊戲。

儘管這種為了遊戲而換顯示卡的行為看起來有“衝動消費”的意思,但回顧近幾年的遊戲史,我們不難發現,每次現象級遊戲走火,同時也有大量玩家為此升級顯示卡。比如用豐富遊戲性推動 GTX 1060 顯示卡的《PUBG》和《守望先鋒》,用出色營銷和畫質推動 RTX 時代的《賽博朋克 2077》,成為 RTX 4060“帶貨王”的《Apex》。可以說每一款成功遊戲的背後,都有一張“現象級 N 卡”。

geforce-rtx-20-series-overview-banner-background-image-spec2-bb580_440-d@2x.png

圖片來源:英偉達

那麼問題也隨之而來——英偉達第一張遊戲顯示卡面世時,遊戲行業是怎樣的呢?

1999 年,英偉達釋出了其第一張遊戲顯示卡——GeForce 256。但在 GeForce 256 釋出之前,市場上已經存在多個顯示卡(GPU)品牌,如 3dfx 的 Voodoo(巫毒)系列、Matrox(邁創)、S3 Graphics、ATI 的 Rage 系列。

和現代的 GPU 一樣,這些 GPU 同樣基於 3D 加速技術,但可惜的是,這些 GPU 產品缺乏統一的 3D 加速制式。這意味著遊戲開發者必須針對不同顯示卡最佳化遊戲,顯著增加了開發成本和難度。此外受產品效能的限制,這些 GPU 也無法支撐複雜的 3D 遊戲。

與此同時,《古墓麗影》、《雷神之錘2》、《星際爭霸》等遊戲的流行也推動了玩家對 3D 遊戲的期望。也就在這時,英偉達 GeForce 256 出現了。

GPU計算爆發,都有哪些先行者?

GeForce 256 是全球首款被稱為 GPU 的產品,源於其首次將圖形處理的多個功能整合於單一晶片,這一行為定義了 GPU 這一概念,同時也將複雜的 3D 渲染任務從 CPU 中解放出來,賦予 GPU 專門的計算職責。從 GPU 的歷史程序來看,這也為後來 GPU 的廣泛應用奠定了基礎。

geforce-256-nvidia-blog-image-1280x660-2-2-2.jpg

圖片來源:英偉達

此外,GeForce 256 也將 T&L(Transform & Lighting、變換與光照)硬體加速整合到 GPU 中,使 3D 場景的變換和光照計算由 GPU 專門負責。這是圖形處理史上的重大突破,以前這類計算任務通常由 CPU 執行,不僅效率低下,而且限制了遊戲畫面的表現力。藉助 GeForce 256,遊戲畫面的複雜性和細節大幅提升,推動了 3D 遊戲時代的到來。

而且 GeForce 256 出色的效能也將 GPU 這一概念帶到遊戲行業之外。彆著急,此時的英偉達還沒拿出 CUDA 這種改變 GPU 行業生態的大殺器。但 GeForce 256 出色的效能,確實為 GPU 在科學計算、金融分析等領域的應用奠定了基礎。

如果說 GeForce 256 開啟了 GPU 圖形運算的時代,那英偉達在 2008 年釋出的 GeForce 8800 GTX,則真正解放了 GPU 的效能。很顯然這張顯示卡的效能放在現在早已不值一提,但這張顯示卡上,英偉達提出了 CUDA(統一計算架構)這一概念。

CUDA 的出現讓 GPU 不僅可以用來處理圖形運算,還可以用來執行、加速基於 CUDA 的通用計算,讓電腦成為真正的通用工具。

96a63d64d128461987e9a97cd38434a9.png

圖片來源:英偉達

而在提出了 CUDA 後,英偉達也在 2018 年進一步對 GPU 的算力進行細化,引入了 RT Core、Tensor Core 的概念,讓光線追蹤和專門的 ML 計算成為可能——Tensor Core 透過高效執行大規模矩陣運算,顯著加快了 AI 模型的訓練和執行速度。

根據英偉達的介紹,現階段 RTX AI 已經對 10 種不同的 AI 場景實現覆蓋,包括遊戲、影視、自動駕駛和科學計算等領域。深受英偉達使用者喜愛、可以顯著提高遊戲 FPS 的 DLSS,就基於 Tensor Core 來實現,可以說是廣大遊戲玩家最早接觸到的真 AI 用例了。

nvidia-studio-ada-ecosystem.jpeg

圖片來源:英偉達

在影視製作領域,RTX AI 加速渲染速度,使複雜的光線和反射效果在短時間內完成,從而縮短了製作週期。在自動駕駛方面,RTX GPU 處理大量影象和感測器資料,支援實時決策,提高車輛的安全性與精準性。此外,AI 還用於醫療影像處理、金融預測和科學模擬,加速資料分析和預測模型的訓練。

不誇張的說,RTX AI 的出現不僅推動了高階視覺效果和 AI 計算的融合,還降低了企業使用 AI 的門檻。它正逐漸成為各行業提升效率、創新業務的關鍵引擎,引領未來技術的發展潮流。

GPU計算驅動AI,但AI計算不全靠GPU

但話說回來,儘管 GPU 的算力提升讓 AI 能以驚人的速度普及,現階段英偉達確實是 AI 算力的代名詞,以及個人 AI 計算機的唯一選擇。但這是否意味著美歐強勁 GPU 的裝置,就無緣 AI 時代呢?

答案是否定的。

在 2024 雲棲大會上,阿里集團 CEO、阿里智慧雲董事長兼 CEO 吳泳銘表示:

生成式 AI 改變計算架構,從 CPU 主導的計算體系到 GPU 主導的 AI 計算遷移。AI 時代將是“GPU 算力為主,CPU 算力為輔”的計算模式。2024 年市場新增算力,超過 50% 的需求 AI 驅動產生,這一趨勢將持續擴大。

不可否認,即使是阿里雲提供的 AI 雲算力,背後也主要由 GPU 驅動。但從另一個方面想,將 GPU 算力集中在雲端,配合裝置本地的 CPU、NPU 進行混合 AI 運算,其實也不失為一個好主意。

首先,這可以緩解算力瓶頸,提升計算靈活性。GPU 在 AI 計算中的核心地位毋庸置疑,但個人開發者和消費者通常難以承受購買和維護大量 GPU 的成本。將 GPU 算力集中在雲端,允許使用者按需租用雲 GPU 資源,可以避免一次性高額投入。這種模式也提供了極大的彈性,可根據任務需要隨時擴充套件或縮減算力。

其次,許多終端裝置受限於尺寸和功耗,無法配備高效能 GPU。透過在雲端完成複雜的 AI 運算,並將結果傳輸至本地裝置執行簡單任務,裝置可以保持輕量化且功耗低。這種混合計算模式,特別適合邊緣裝置和移動終端。

nvidia-dgx-cloud.jpg

圖片來源:英偉達

而且在本地 CPU 和 NPU 的配合下,雲 GPU 的計算能力可以得到最大化利用:裝置本地的 NPU 可以快速處理延遲敏感的任務,如語音識別和實時影象分析;而複雜的模型訓練和推理則交由雲端 GPU 完成。這種模式有效縮短了計算響應時間,提升了使用者體驗。

短時間來看,英偉達在 AI 算力市場的優勢仍然巨大,但是長遠來看,群狼環伺之下的 AI 市場,英偉達雙拳難敵四手。諸如移動 PC、智慧終端等英偉達的弱勢市場,很快就會被其他廠商瓜分乾淨,而關鍵的伺服器市場也並非高枕無憂,AMD 的 MI300 系列 AI 顯示卡份額增長迅速,已經足夠引起英偉達的警覺。

不過,競爭所帶來的創新與發展,才是科技進步的關鍵,隨著 AI 領域的競爭加劇,實際上也在推動 AI 成本的下降,讓 AI 技術得到更快、更廣泛的應用。就像吳泳銘說的那樣:

AI 驅動的數字世界連線著具備 AI 能力的物理世界,將會大幅提升整個世界的生產力,對物理世界的執行效率產生革命性的影響。

一個圍繞 AI 而生的新生態,此時此刻就在我們面前。

文章版權及轉載聲明

本站內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容,請發送郵件至舉報,壹經查實,本站將立刻刪除。