01 為什么是英偉達(dá)
全球科技巨頭,GPU王者——英偉達(dá)
英偉達(dá)(NVIDIA)是全球GPU巨頭。英偉達(dá)成立于1993年,總部位于美國(guó)加利福尼亞州。公司專注于GPU的研發(fā)與制造,2009年發(fā)布了費(fèi) 米(Fermi)架構(gòu),確立了在游戲領(lǐng)域的主導(dǎo)地位。公司業(yè)務(wù)包括數(shù)據(jù)中心、游戲、科學(xué)計(jì)算和自動(dòng)駕駛。在人工智能領(lǐng)域,TensorCore作 為深度學(xué)習(xí)的處理單元,為AI提供高效的計(jì)算和學(xué)習(xí)能力。出色的軟件研發(fā)為公司持續(xù)發(fā)展提供支持,CUDA平臺(tái)和深度學(xué)習(xí)庫(kù)廣泛應(yīng)用 于科研和大數(shù)據(jù)等領(lǐng)域。
2016年至今股價(jià)大幅增長(zhǎng)近60倍,AI開(kāi)啟全新增長(zhǎng)周期。英偉達(dá)(NVIDIA)截至2023年5月30日的總市值為9631.8億美元,收盤價(jià)為每股 389.46美元。根據(jù)JonPenddie Reasearch數(shù)據(jù),獨(dú)立顯卡市場(chǎng)中,英偉達(dá)在全球GPU市場(chǎng)占有84%份額。近20年,英偉達(dá)業(yè)績(jī)收入大幅 增長(zhǎng)15倍,業(yè)績(jī)持續(xù)爆發(fā)式增長(zhǎng),我們認(rèn)為這是英偉達(dá)股價(jià)持續(xù)增高的根本原因。此外,公司在2015年開(kāi)啟布局相應(yīng)人工智能領(lǐng)域,并于 2019年嶄露頭角并逐漸成為全球AI巨頭,如今,隨著大模型的爆發(fā),英偉達(dá)作為AI硬件龍頭,開(kāi)啟第二波成長(zhǎng)曲線。
30年王者之路,AI硬件巨頭崛起
競(jìng)爭(zhēng)激烈,勇于破冰(1993年-1998年):英偉達(dá)于1993年進(jìn)入市場(chǎng),當(dāng)時(shí)顯示芯片行業(yè)競(jìng)爭(zhēng)激烈。1995年,英偉達(dá)推出NV1,但成效不 明顯,財(cái)政形勢(shì)緊張。然而,1997年,公司推出了全球首款128位3D處理器RIVA 128(加速圖形處理芯片),僅前四個(gè)月就售出超過(guò)一百 萬(wàn)臺(tái),成功逆襲。此后,英偉達(dá)在1998年繼續(xù)發(fā)力,發(fā)布了兩款高性能的3D處理器,RIVA 128ZX和RIVA TNT。
成功上市,高速發(fā)展(1999年-2005年): 1999年1月,英偉達(dá)在NASDAQ股票交易所以每股12美元的價(jià)格進(jìn)行了首次公開(kāi)募資。同年 八月,發(fā)布了全球首款GPU(GeForce 256),將GPU定義為具備集成變換、照明、三角設(shè)置、裁剪和渲染引擎的單片處理器,能夠每秒處 理至少1000萬(wàn)個(gè)多邊形。英偉達(dá)成為發(fā)展最快的半導(dǎo)體公司之一,收入達(dá)到10億美元,并被納入S&P500指數(shù)。
CUDA問(wèn)世,強(qiáng)調(diào)生態(tài)(2006年-2009年):2006年推出了CUDA,一種用于通用GPU計(jì)算的革命性架構(gòu),使科學(xué)家和研究人員能夠進(jìn)行更 復(fù)雜的計(jì)算。2009年發(fā)布了首個(gè)完整的GPU計(jì)算架構(gòu)(Fermi),其中Quadro 7000代表著一個(gè)飛躍,實(shí)現(xiàn)了游戲性能和計(jì)算性能的雙重 提升。
產(chǎn)品:圖形顯控+計(jì)算中心加速卡雙輪驅(qū)動(dòng)
公司GPU產(chǎn)品功能分為1)用于計(jì)算和網(wǎng)絡(luò)(Compute & Networking)的GPGPU;2)用于圖形處理(Graphics)的GPU。 GPGPU(General Purpose GPU):通用計(jì)算圖形處理器。在架構(gòu)設(shè)計(jì)中去掉了GPU為圖形處理設(shè)計(jì)的加速硬件單元,保留了SIMT架構(gòu) 和通用計(jì)算單元??梢詫PU的并行計(jì)算能力應(yīng)用于科學(xué)計(jì)算、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等領(lǐng)域,提高計(jì)算速度和效率。 GPU(Graphics Processing Unit):完成圖像運(yùn)算工作的微處理器。作為一個(gè)單獨(dú)的模塊,即獨(dú)立顯卡核心或者主板集成顯卡核心。主要 用于提供高性能的圖形渲染能力。
根據(jù)2023財(cái)年年報(bào),公司計(jì)算與網(wǎng)絡(luò)類GPGPU收入150.68億美元,圖形處理類GPU收入119.06億美元。其中1)計(jì)算與網(wǎng)絡(luò)類收入同比 +36%,主要應(yīng)用于數(shù)據(jù)中心加速計(jì)算平臺(tái)、人工智能駕駛艙、自動(dòng)駕駛解決方案、電動(dòng)汽車計(jì)算平臺(tái)、NVIDIA AI企業(yè)和其他軟件、加密 貨幣挖掘等。2)圖形處理類收入同比-25%,主要應(yīng)用于游戲和個(gè)人電腦的GeForce圖形處理器、游戲平臺(tái)的解決方案、基于云的視覺(jué)和 虛擬計(jì)算的軟件、構(gòu)建和操作3D互聯(lián)網(wǎng)應(yīng)用程序的全方位企業(yè)軟件等。
業(yè)務(wù): 打造多元產(chǎn)品矩陣,數(shù)據(jù)中心與游戲?yàn)楹诵?/strong>
公司軟硬件結(jié)合平臺(tái)化布局,打造4條產(chǎn)品線覆蓋下游主流應(yīng)用:
數(shù)據(jù)中心:2023財(cái)年收入150.1億美元,占比56%?;?GPU、DPU 和 CPU 三種新一代架構(gòu)構(gòu)建的 NVIDIA 加速計(jì)算平臺(tái),推出NVIDIA DGX 人工智能超級(jí)計(jì)算機(jī),讓現(xiàn)代化的數(shù)據(jù)中心更快速地處理涉及深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和高性能計(jì)算 (HPC) 的工作負(fù)載。
游戲:2023財(cái)年收入90.7億美元,占比34%。產(chǎn)品包括GeForce RTX和GeForce GTX圖形處理器,云游戲GeForce NOW,用于流媒體的 屏蔽以及芯片系統(tǒng)(SOCs)和游戲機(jī)的開(kāi)發(fā)服務(wù)。2023財(cái)年推出基于Ada Lovelace架構(gòu)的GeForce RTX 40系列游戲圖形處理器。
專業(yè)可視化:2023財(cái)年收入15.4億美元,占比6%。應(yīng)用于許多領(lǐng)先的3D設(shè)計(jì)和內(nèi)容創(chuàng)建,如全宇宙、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)技術(shù)。利用 GPU在設(shè)計(jì)制造、數(shù)字內(nèi)容創(chuàng)建方面提供動(dòng)力。推出的NVIDIA RTX平臺(tái)可利用光線跟蹤,實(shí)時(shí)渲染膠片質(zhì)量、逼真的物體和環(huán)境。
自動(dòng)駕駛:2023財(cái)年收入9.0億美元,占比3%。包括AV、人工智能駕駛艙、電動(dòng)汽車計(jì)算平臺(tái)和信息娛樂(lè)平臺(tái)解決方案。根據(jù)2023財(cái)年年 報(bào),公司正與數(shù)百名汽車生態(tài)伙伴合作,包括汽車產(chǎn)業(yè)鏈制造商、汽車研究機(jī)構(gòu)、地圖公司和初創(chuàng)公司,為自動(dòng)駕駛汽車開(kāi)發(fā)和部署人工 智能系統(tǒng)。推出的Drive作為一個(gè)人工智能汽車平臺(tái),覆蓋多種自動(dòng)駕駛領(lǐng)域。
CUDA開(kāi)啟軟硬件生態(tài),形成護(hù)城河
GPU適用于處理大數(shù)據(jù)集,CUDA核是本質(zhì)原因。最開(kāi)始,GPU(圖形處理單元)作為一種專用計(jì)算機(jī)處理器,可以滿足實(shí)施高分辨率 3D圖形計(jì)算密集型任務(wù)的需求。到2012年,由于GPU已經(jīng)發(fā)展成為高度并行的多核系統(tǒng),讓它具備了處理大量數(shù)據(jù)的能力。簡(jiǎn)而言之, CPU做的專注線性計(jì)算,GPU做的是并行計(jì)算(數(shù)據(jù)之間沒(méi)有直接關(guān)系),而本質(zhì)的原因是CUDA核的不同,CUDA核越多,計(jì)算性能越 強(qiáng),而GPU的CUDA核數(shù)是CPU的上百倍,如AMD EPYC 7003系列7763核心數(shù)為64個(gè),而英偉達(dá)A100 40GB核心數(shù)為6912個(gè)。
CUDA的本質(zhì)是“軟件定義硬件”,實(shí)現(xiàn)“軟件調(diào)用硬件”。 CUDA是一種并行計(jì)算平臺(tái)和應(yīng)用程序編程接口(API),允許軟件使用特 定類型的圖形處理單元(GPU)進(jìn)行通用目的的處理,稱為通用圖形處理單元計(jì)算(GPGPU)。CUDA提供了直接訪問(wèn)GPU虛擬指令集和并 行計(jì)算元素的軟件層,用于執(zhí)行計(jì)算內(nèi)核。CUDA支持的GPU還可以使用編程框架,通過(guò)將代碼編譯為CUDA來(lái)使用HIP。CUDA將從 前多種不同的代碼整合成了一氣呵成的代碼,這樣極大的加快了開(kāi)發(fā)模型的訓(xùn)練速度。可以簡(jiǎn)單理解,CUDA是英偉達(dá)實(shí)現(xiàn)軟硬件適配 的一種“類編譯器”,將軟件的代碼轉(zhuǎn)換成硬件匯編代碼,CUDA是英偉達(dá)實(shí)現(xiàn)軟硬件生態(tài)的護(hù)城河。
英偉達(dá)今年發(fā)布多款A(yù)I產(chǎn)品,助力全球AI生態(tài)
2023年3月23日GTC會(huì)議,英偉達(dá)全新AI相關(guān)產(chǎn)品助力全球AI生態(tài)。1)基礎(chǔ)軟件:推出全新加速庫(kù);2)芯片方面:推出數(shù)據(jù)中心 Grace CPU,具備高能效、高運(yùn)行速度等優(yōu)勢(shì);3)服務(wù)器:推出DGX超級(jí)計(jì)算機(jī);4)全新AI服務(wù)平臺(tái)(DGX云與生成式AI服務(wù)), AI的“Iphone”時(shí)刻已經(jīng)來(lái)臨,AI foundations 云服務(wù)能夠構(gòu)建、改進(jìn)和操作定制的大型語(yǔ)言模型和生成式 AI 模型,助力初創(chuàng)企業(yè)具備 擁有生成式AI的能力,且已經(jīng)具備多種生成式AI模型和相應(yīng)案例。
平臺(tái)實(shí)為模型和算力之間的“橋梁”,是AIGC或大模型生成的必備要素,不論是數(shù)據(jù)庫(kù)還是編譯器,都需要通過(guò)平臺(tái)來(lái)實(shí)現(xiàn)資源的合 理分配以達(dá)到軟硬件的最優(yōu)組合,從而大幅提升模型效率。平臺(tái)通過(guò)調(diào)用數(shù)據(jù)包來(lái)適配軟硬件之間的結(jié)構(gòu),來(lái)達(dá)到模型的最優(yōu)組合,從 而提升模型乃至整個(gè)虛擬機(jī)的效率。
02 AI硬件自主可控勢(shì)在必行
英偉達(dá)成功轉(zhuǎn)型成全球AI硬件龍頭
英偉達(dá)已經(jīng)成功的從一家圖形處理器公司轉(zhuǎn)型為引爆人工智能的綜合性硬件公司。GPU技術(shù)在AI應(yīng)用中發(fā)揮著重要的作用,其并行計(jì)算 的能力處于領(lǐng)先地位。AI平臺(tái)—NVIDIA DGX系統(tǒng)作為一套高性能計(jì)算解決方案,集成了英偉達(dá)的GPU和軟件工具,讓開(kāi)發(fā)者更加便 捷的構(gòu)建、訓(xùn)練和部署AI。軟件方面推出NVIDIA CUDA和NVIDIA cuDNN,提供了快速的神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推斷功能。英偉達(dá)的技術(shù)在 AI領(lǐng)域被廣泛應(yīng)用于智能駕駛、深度學(xué)習(xí)、金融服務(wù)、醫(yī)療保健、游戲開(kāi)發(fā)和建筑工程等各個(gè)領(lǐng)域。
醫(yī)療保?。杭涌焖幬锏难邪l(fā)速度,NVIDIA推出NVIDIA Clara Discovery的AI加速計(jì)算平臺(tái),可支持化學(xué)信息學(xué)研究、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、 藥物篩選和分子動(dòng)力學(xué)等研究。推出大語(yǔ)言模型BioNeMo可用于訓(xùn)練和部署大型生物分子語(yǔ)言模型。更新醫(yī)療設(shè)備,運(yùn)用NVIDIA強(qiáng)大 的GPU的分析和成像技術(shù),打造用于影像診斷、數(shù)字手術(shù)和病人監(jiān)護(hù)等多種醫(yī)療設(shè)備,大大提高治療精度和效率。
游戲開(kāi)發(fā):為游戲開(kāi)發(fā)提供NVIDIA游戲技術(shù),例如,有生成式AI提供支持的智能游戲角色鑄造平臺(tái)—NVIDIAACE、AI神經(jīng)圖形技術(shù)— NVIDIA DLSS、可擴(kuò)展的多GPU實(shí)時(shí)推理開(kāi)發(fā)平臺(tái)(用于3D方針和設(shè)計(jì))—NVIDIA Omniverse平臺(tái)等。這些平臺(tái)幫助游戲開(kāi)發(fā)這一創(chuàng) 紀(jì)錄的速度構(gòu)建逼真且精確的游戲。
建筑工程:加速設(shè)計(jì)流程,提高工作效率,NVIDIA RTX驅(qū)動(dòng)的工作站通過(guò)實(shí)時(shí)光線追蹤、虛擬現(xiàn)實(shí)、工程模擬和支持AI的應(yīng)用程序增 強(qiáng)建筑和基礎(chǔ)設(shè)施設(shè)計(jì)工作流程。Omniverse平臺(tái)克服了設(shè)計(jì)軟件之間操作沖突的問(wèn)題。NVIDIA Quadro GPU可快速分析復(fù)雜的流體 場(chǎng)景,使用NVLink技術(shù)加速,可以大大縮短設(shè)計(jì)、建模、模擬和檢查等過(guò)程的時(shí)間。
再三強(qiáng)調(diào),大模型背景下算力勢(shì)必迎來(lái)爆發(fā)
ChatGPT開(kāi)啟算力軍備賽: 我們已經(jīng)在《ChatGPT: 百度文心一言暢想》中提到數(shù)據(jù)、平臺(tái)、算力是打造大模型生態(tài)的必備基礎(chǔ),且算力 是訓(xùn)練大模型的底層動(dòng)力源泉,一個(gè)優(yōu)秀的算力底座在大模型(AI算法)的訓(xùn)練和推理具備效率優(yōu)勢(shì);同時(shí),我們?cè)凇禖hatGPT打響AI算 力“軍備戰(zhàn)”》中提及算力是AI技術(shù)角逐“入場(chǎng)券”,其中AI服務(wù)器、AI芯片等為核心產(chǎn)品;此外,我們還在《ChatGPT , 英偉達(dá)DGX 引爆 AI “核聚變”》中提到以英偉達(dá)為代表的科技公司正在快速補(bǔ)足全球AI算力需求,為大模型增添必備“燃料”。
大模型參數(shù)呈現(xiàn)指數(shù)規(guī)模,引爆海量算力需求: 根據(jù)財(cái)聯(lián)社和OpenAI數(shù)據(jù),ChatGPT浪潮下算力缺口巨大,根據(jù)OpenAI數(shù)據(jù),模型計(jì)算 量增長(zhǎng)速度遠(yuǎn)超人工智能硬件算力增長(zhǎng)速度,存在萬(wàn)倍差距。運(yùn)算規(guī)模的增長(zhǎng),帶動(dòng)了對(duì)AI訓(xùn)練芯片單點(diǎn)算力提升的需求,并對(duì)數(shù)據(jù)傳 輸速度提出了更高的要求。根據(jù)智東西數(shù)據(jù),過(guò)去五年,大模型發(fā)展呈現(xiàn)指數(shù)級(jí)別,部分大模型已達(dá)萬(wàn)億級(jí)別,因此對(duì)算力需求也隨之 攀升。
美國(guó)限制高端芯片流入中國(guó),嚴(yán)重干擾國(guó)內(nèi)大模型發(fā)展生態(tài)
美國(guó)政府禁止英偉達(dá)、AMD向中國(guó)出口用于人工智能的頂級(jí)計(jì)算芯片。 根據(jù)鈦媒體,2022年9月,美國(guó)商務(wù)部宣布限制英偉達(dá)(NVIDIA)和AMD等美國(guó)公司向中國(guó)出口先進(jìn)計(jì)算機(jī)圖像處理器(GPU),該禁 令主要限制了英偉達(dá)的A100、H100高端芯片以及AMD的MI250出口中國(guó),目的是瞄準(zhǔn)國(guó)內(nèi)先進(jìn)計(jì)算進(jìn)行遏制,影響國(guó)內(nèi)人工智能領(lǐng)域發(fā) 展。
浪潮集團(tuán)被加入“實(shí)體清單”:根據(jù)鈦媒體,2023年3月美國(guó)商務(wù)部發(fā)布浪潮被加入被加入美國(guó)“實(shí)體清單”,限制了美國(guó)科技公司對(duì)浪 潮的技術(shù)、產(chǎn)品支持。浪潮的服務(wù)器業(yè)務(wù)在CPU、GPU等關(guān)鍵芯片技術(shù)商高度依賴外國(guó)廠商,此外,截至2022年末,浪潮服務(wù)器及部件占 總營(yíng)收99.17%,若此次制裁被嚴(yán)格落實(shí),其服務(wù)器業(yè)務(wù)將嚴(yán)重停滯。
產(chǎn)業(yè)端積極響應(yīng),智能算力建設(shè)持續(xù)提速
北京昇騰人工智能計(jì)算中心正式點(diǎn)亮:北京昇騰人工智能計(jì)算中心正式點(diǎn)亮,將 推動(dòng)北京人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展。該智能計(jì)算中心采用昇騰AI基礎(chǔ)軟硬件,充 分釋放硬件算力,加速人工智能企業(yè)創(chuàng)新應(yīng)用和模型孵化。
貴州省大數(shù)據(jù)局印發(fā)《面向全國(guó)的算力保障基地建設(shè)規(guī)劃》:總體目標(biāo)是到2025 年,面向全國(guó)的算力保障基地建設(shè)任務(wù)全面完成,貴州超大規(guī)模數(shù)據(jù)中心集群的 地位更加鞏固,存算比更加合理,優(yōu)化基礎(chǔ)設(shè)施布局、結(jié)構(gòu)、功能和系統(tǒng)集成, 數(shù)據(jù)中心實(shí)現(xiàn)集約化、規(guī)模化、綠色化發(fā)展,網(wǎng)絡(luò)互聯(lián)互通、能源安全可靠提高 到新的水平,打造具有國(guó)際競(jìng)爭(zhēng)力的數(shù)字產(chǎn)業(yè)集群。
“共享AI能力與算力” ,AI云需求高增
部署生成式 AI 應(yīng)用難度較高,AI云提供平臺(tái)定制化能力。隨著大模型帶來(lái)的人工智能產(chǎn)業(yè)崛起,AI應(yīng)用如文本生成、自動(dòng)客服、自動(dòng) 駕駛等領(lǐng)域快速擴(kuò)張。對(duì)于大多數(shù)企業(yè)自己部署這樣的能力是非常困難的,我們認(rèn)為一是由于目前的算力缺口及訓(xùn)練的邊際成本較高, 二是由于全鏈部署應(yīng)用需要深厚的軟硬件結(jié)合生態(tài)技術(shù)。而AI云可將如英偉達(dá)等專業(yè)供應(yīng)商的AI能力整合到云上,讓企業(yè)能夠直接接入 應(yīng)用或從基礎(chǔ)層進(jìn)行預(yù)訓(xùn)練,進(jìn)而形成自己的模型和應(yīng)用。
AI云需求快速增長(zhǎng),云算力革命開(kāi)啟。在企業(yè)對(duì)大模型訓(xùn)練、人工智能應(yīng)用部署等AI能力需求持續(xù)上行的態(tài)勢(shì)下,AI云產(chǎn)品受到市場(chǎng)的 青睞。以阿里、騰訊為代表的平臺(tái)型公司在云端市場(chǎng)布局上,更多地關(guān)注的是通用云的打造;而華為、曙光更多地是從硬件的角度著手 加入云市場(chǎng)布局。我們認(rèn)為軟硬結(jié)合的AI云玩家(英偉達(dá)、首都在線)符合市場(chǎng)的需求。同時(shí),AI云需求高增也意味著未來(lái)掌握智算卡 的企業(yè)將繼續(xù)占領(lǐng)市場(chǎng)高地,萬(wàn)變不離其宗,我們堅(jiān)持認(rèn)為擁有算力的企業(yè)在下一階段進(jìn)行應(yīng)用和平臺(tái)化競(jìng)爭(zhēng)的過(guò)程中具有先發(fā)優(yōu)勢(shì)。