<bdo id="ks4iu"><del id="ks4iu"></del></bdo>
  • 
    <pre id="ks4iu"></pre>
  • <bdo id="ks4iu"><del id="ks4iu"></del></bdo>
    <input id="ks4iu"><em id="ks4iu"></em></input>
    
    
  • <center id="ks4iu"><cite id="ks4iu"></cite></center>
  • 首頁 > 智能影音 >

    天天最資訊丨國君海外科技:AMD MI 300表現(xiàn)亮眼,但暫時難以撼動英偉達(dá)的市場統(tǒng)治格局

    報告導(dǎo)讀

    AMD系列新品重磅來襲,MI 300X表現(xiàn)亮眼,成為AI算力增量市場的有效補(bǔ)充,但暫未撼動英偉達(dá)在GPU市場的統(tǒng)治地位。

    摘要


    (相關(guān)資料圖)

    投資建議:AMD MI300系列為AI算力市場貢獻(xiàn)增量,芯片市場“贏家通吃”英偉達(dá)仍占AI芯片主導(dǎo)地位,推薦標(biāo)的英偉達(dá)(NVDA.O)。

    以MI 300X為代表的AMD系列新品重磅發(fā)布,整體表現(xiàn)亮眼。AMD舉行“AMD數(shù)據(jù)中心與人工智能技術(shù)首映會”,發(fā)布了一系列新產(chǎn)品。其中,MI 300X針對大語言模型進(jìn)行優(yōu)化,產(chǎn)品性能大幅突破。MI 300X與MI 300A類似,由多個chiplets組成,在chiplets間內(nèi)存和網(wǎng)絡(luò)鏈接可實現(xiàn)共享。但MI300X移除了MI300A 上原有的CPU chiplets,成為了純GPU產(chǎn)品。從參數(shù)上看,MI300X基于CDNA 3,擁有192GB的HBM3 DRAM內(nèi)存,5.2TB/s的內(nèi)存帶寬,Infinity Fabric帶寬896GB/s和1530億個晶體管,采用5nm和6nm的制程并含13個chiplets。

    AMD的MI 300系列產(chǎn)品作為全球AI算力的新供給,是AI算力增量市場有效補(bǔ)充,但暫時難以撼動英偉達(dá)在AI芯片市場的統(tǒng)治格局。第一,在硬件端,英偉達(dá)具備系統(tǒng)性集成競爭優(yōu)勢。GH200集合了Grace Hopper架構(gòu),并應(yīng)用第四代Tensor Core提升計算性能、進(jìn)行模型優(yōu)化,以及NVLink實現(xiàn)高速傳輸,這些系統(tǒng)性的優(yōu)化并不僅是MI 300X部分硬件參數(shù)的提升所能比擬的,而這超異構(gòu)創(chuàng)新正形成了英偉達(dá)在硬件端的競爭壁壘,實現(xiàn)了芯片和系統(tǒng)耦合。

    第二,軟件端CUDA打造高兼容性的GPU通用平臺,形成的壁壘短期內(nèi)ROCm無法打破。CUDA具備ROCm難以企及的開發(fā)人員數(shù)量,目前CUDA 擁有超過400萬開發(fā)人員,歷史上CUDA總下載量達(dá)到4000萬,整體而言,在發(fā)布時間、硬件支持、操作系統(tǒng)和開發(fā)者數(shù)量等維度上CUDA均具備優(yōu)勢,展現(xiàn)出更加繁榮的生態(tài)。

    此外,量產(chǎn)時間、合作伙伴網(wǎng)絡(luò)和研發(fā)人員等因素均成為了英偉達(dá)的競爭優(yōu)勢的有力加持。MI300 X目前仍未送樣,距離實現(xiàn)量產(chǎn)也還有較長時間,仍需經(jīng)過產(chǎn)業(yè)實踐;而英偉達(dá)H100已在去年9月實現(xiàn)量產(chǎn),GH200目前也已投入量產(chǎn),上市時間指日可待;英偉達(dá)已形成了多元而龐大的客戶群和完備的合作伙伴網(wǎng)絡(luò),整體積淀暫時優(yōu)于AMD;隨著英偉達(dá)研發(fā)人員數(shù)量和研發(fā)投入的高增,我們看好后續(xù)英偉達(dá)產(chǎn)品的迭代速度。

    風(fēng)險提示:AI應(yīng)用發(fā)展不及預(yù)期;產(chǎn)品出貨時間不及預(yù)期;地緣政治沖突。

    目錄

    報告正文

    1

    AI算力新供給,AMD MI300新品重磅發(fā)布

    在2023年6月13日AMD舉行的“AMD數(shù)據(jù)中心與人工智能技術(shù)首映會”中,AMD發(fā)布了一系列新產(chǎn)品,包括第四代AMD EPYC(霄龍)產(chǎn)品組合、EPYC“Bergamo”CPU、EPYC “Genoa” CPU 、EPYC “Genoa-X” CPU、P4 DPU等。其中最受人關(guān)注的莫屬AMD AI Platforms中的硬件端MI300A、MI300X和Instinct Platform的發(fā)布。

    1.1.MI300A專為AI和HPC打造

    MI300A成為全球首個為AI和HPC打造的APU加速卡。公司CEO蘇姿豐率先公布了MI300A,稱這是全球首個為AI和HPC(高性能計算)打造的APU加速卡。MI300A總共包含1460億個晶體管,含13個chiplets,24個Zen 4 CPU核心,1個CDNA 3GPU和128GB HBM3內(nèi)存,采用5nm和6nm的制程,CPU和GPU共用統(tǒng)一內(nèi)存。與MI 250相比,MI 300A提供了8倍的性能和5倍的效率。目前,MI300A已經(jīng)送樣。

    1.2MI300X針對LLM進(jìn)行優(yōu)化,性能高于MI 300A

    MI 300X表現(xiàn)亮眼,內(nèi)存帶寬大幅突破。MI300X與MI 300A類似,也是由多個chiplets組成的芯片,在chiplets間內(nèi)存和網(wǎng)絡(luò)鏈接可實現(xiàn)共享。但與MI 300A不同的是,MI 300X移除了 MI300A 上原有的CPU chiplets,成為了純GPU產(chǎn)品。MI300X同樣基于CDNA 3,擁有192GB的HBM3 DRAM內(nèi)存,5.2TB/s的內(nèi)存帶寬,Infinity Fabric帶寬896GB/s和1530億個晶體管,同樣采用5nm和6nm的制程并含13個chiplets。MI300X計劃于23Q3送樣、23Q4出貨。

    MI300X性能顯著高于MI300A。對比MI 300X 和MI 300A,MI300A是由3個Zen4 CPU chiplets和多個GPU chiplets組成的,但在MI300X中,CPU被換成了2個額外的CDNA 3 chiplets,MI300X的晶體管數(shù)量也從1460億增加到了1530億。為滿足大語言模型對內(nèi)存的需求, MI 300X的DRAM內(nèi)存從MI300A的128GB增加到了192GB,內(nèi)存帶寬從800GB/s增加到了5.2TB/s。

    MI300X是針對大語言模型進(jìn)行了優(yōu)化的版本。MI 300X能夠在內(nèi)存中處理高達(dá)800億參數(shù)的大型語言模型的芯片,蘇姿豐將其稱為“生成式AI加速器”,并表示其包含的CDNA 3 GPU chiplets是專門為AI和HPC工作負(fù)載而設(shè)計。此外,她在發(fā)布會中展示了MI300X如何使用Falcon-40B大型語言模型在內(nèi)存中運行一個40億參數(shù)的神經(jīng)網(wǎng)絡(luò),而不需要將數(shù)據(jù)在外部內(nèi)存中來回移動。

    MI300X部分性能可對標(biāo)英偉達(dá)H100GPU。蘇姿豐表示,MI300X將提供英偉達(dá)H100 Hopper GPU2.4倍的內(nèi)存密度和1.6倍的內(nèi)存帶寬。我們認(rèn)為,AMD MI300X在內(nèi)存密度和內(nèi)存帶寬等參數(shù)上已優(yōu)于英偉達(dá)可比產(chǎn)品,MI 300X將一定程度影響AI加速卡市場份額。

    1.3 AMD Instinct Platform實現(xiàn)現(xiàn)有基礎(chǔ)架構(gòu)的直接使用

    Instinct Platform實現(xiàn)在現(xiàn)有的基礎(chǔ)架構(gòu)中直接使用MI300X的AI計算能力和內(nèi)存。蘇姿豐在發(fā)布會中同時發(fā)布了AMD Instinct Platform,Instinct Platform將結(jié)合8個MI300X和1.5TB的HMB3內(nèi)存,并采用工業(yè)級標(biāo)準(zhǔn)化設(shè)計。通過利用行業(yè)標(biāo)準(zhǔn)的OCP基礎(chǔ)架構(gòu),Instinct Platform可直接使用MI300X的AI計算能力和內(nèi)存,在降低了客戶總體開發(fā)成本的基礎(chǔ)上也加速了客戶的上市時間,實現(xiàn)了輕松部署的效能。

    2

    英偉達(dá)在GPU市場統(tǒng)治地位短期不會改變

    英偉達(dá)持續(xù)加大研發(fā)投入,注重創(chuàng)新能力培育。據(jù)FourWeekMBA統(tǒng)計,截至2023年1月,英偉達(dá)全球員工總數(shù)共26196人,其中研發(fā)人員19532人,研發(fā)人員占比約75%,四年間英偉達(dá)研發(fā)人員數(shù)量近乎翻倍。其中很多員工來自英特爾和AMD,由于英偉達(dá)在GPU市場的龍頭地位,其對于芯片開發(fā)者而言具備較高的吸引力,頭部效應(yīng)吸引大量高端人才注入,因此維護(hù)了自己的研發(fā)能力優(yōu)勢。

    英偉達(dá)以超異構(gòu)創(chuàng)新構(gòu)建面向大規(guī)模AI計算的超級計算機(jī)。我們認(rèn)為,英偉達(dá)的核心競爭優(yōu)勢在于,構(gòu)建了AI時代面向大規(guī)模并行計算而設(shè)的全棧異構(gòu)的數(shù)據(jù)中心。英偉達(dá)NVLink性能快速迭代,同時NVSwitch可連接多個NVLink,在單節(jié)點內(nèi)和節(jié)點間實現(xiàn)以NVLink能夠達(dá)到的最高速度進(jìn)行多對多GPU通信,滿足了在每個GPU之間、GPU和CPU間實現(xiàn)無縫高速通信的需求,同時基于DOCA加速數(shù)據(jù)中心工作負(fù)載的潛力,實現(xiàn)DPU的效能提升,GPU +Bluefield DPU+Grace CPU的結(jié)合開創(chuàng)性地實現(xiàn)了芯片間的高速互聯(lián)。同時CUDA充當(dāng)通用平臺,引入英偉達(dá)軟件服務(wù)和全生態(tài)系統(tǒng)。我們認(rèn)為,芯片和系統(tǒng)耦合的實現(xiàn)使得英偉達(dá)真正實現(xiàn)了超異構(gòu)創(chuàng)新。

    英偉達(dá)自研Grace Hopper超級芯片,為AI數(shù)據(jù)中心而生。Grace Hopper是適用于大規(guī)模AI和HPC應(yīng)用的突破性加速CPU。通過NVLink-C2C 技術(shù)將Grace和Hopper架構(gòu)相結(jié)合,為加速AI和HPC應(yīng)用提供 CPU+GPU 相結(jié)合的一致內(nèi)存模型。它采用新型900 GB/s一致性接口,比PCIe 5.0快7倍,并可運行所有的英偉達(dá)軟件棧和平臺,包括 NVIDIA HPC SDK、NVIDIA AI和NVIDIA Omniverse。

    英偉達(dá)CUDA構(gòu)筑軟件業(yè)務(wù)底層框架基石,打造高兼容性的GPU通用平臺。借助英偉達(dá) CUDA 工具包,開發(fā)者可以在GPU加速的嵌入式系統(tǒng)、桌面工作站、企業(yè)數(shù)據(jù)中心、基于云的平臺和HPC超級計算機(jī)上開發(fā)、優(yōu)化和部署應(yīng)用程序。CUDA最初用于輔助GeForce提升游戲開發(fā)效率,但隨著CUDA的高兼容性優(yōu)勢彰顯,英偉達(dá)將GPU的應(yīng)用領(lǐng)域拓展至計算科學(xué)和深度學(xué)習(xí)領(lǐng)域。CUDA可以充當(dāng)英偉達(dá)各GPU系列的通用平臺,因此開發(fā)者可以跨GPU配置部署并擴(kuò)展應(yīng)用。目前,通過 CUDA 開發(fā)的數(shù)千個應(yīng)用目前已部署到嵌入式系統(tǒng)、工作站、數(shù)據(jù)中心和云中的GPU。

    CUDA形成的壁壘短期內(nèi)ROCm無法打破,成為英偉達(dá)與AMD市場份額差距的重要影響因素。在COMPUTEX 2023中,英偉達(dá)表示,目前CUDA 擁有超過400萬開發(fā)人員,歷史上CUDA 的總下載量也達(dá)到驚人的4000萬。而ROCm作為AMD為對標(biāo)英偉達(dá)而打造的開放式軟件平臺,2016年4月首次發(fā)布,相比2007年發(fā)布的CUDA目前使用的人數(shù)依舊較少。ROCm操作系統(tǒng)直至2023年4月才支持Windows,改變了僅支持Linux的尷尬局面,同時長期僅支持Radeon Pro系列GPU,近期才開始陸續(xù)拓展。此外,ROCm缺少類似于CUDA的社區(qū)支持和成熟的生態(tài)體系。我們認(rèn)為,目前CUDA已形成極高的準(zhǔn)入壁壘,也成為了英偉達(dá)持續(xù)擴(kuò)展人工智能領(lǐng)域市場的品牌影響力來源,帶動了英偉達(dá)GPU的高市場份額,短期內(nèi)ROCm的軟件支持難以匹敵CUDA。

    MI 300較英偉達(dá)GH 200部分硬件參數(shù)差距有望對標(biāo),但整體仍存在一定差距。GH200超級芯片是英偉達(dá)系統(tǒng)性競爭優(yōu)勢的集大成者,將72核的Grace CPU、H100 GPU、96GB的HBM3和512 GB的LPDDR5X 集成在同一個封裝中,它集合了最先進(jìn)的Grace Hopper架構(gòu),并應(yīng)用第四代Tensor Core提升計算性能、進(jìn)行模型優(yōu)化,NVLink實現(xiàn)了高速的傳輸,這都將進(jìn)一步形成英偉達(dá)的競爭壁壘。通過將英偉達(dá)GH 200和MI 300進(jìn)行對比,我們認(rèn)為,MI 300還有許多參數(shù)有待后續(xù)公布,但從算力、內(nèi)存等指標(biāo)上有望和英偉達(dá)實現(xiàn)對標(biāo),但在架構(gòu)、制程和晶體管數(shù)量上仍與英偉達(dá)GH 200存在一定差距。

    芯片市場具有一定的“贏家通吃”性。1)以全球x86 CPU服務(wù)器處理器市場為例,據(jù)Mercury Research,英特爾占超80%的市場份額;2)以獨立顯卡市場為例,據(jù)JPR測算,英偉達(dá)長期占全球獨立顯卡的市場份額近80%;3)以基帶芯片市場為例,據(jù)TechInsights,高通在2022年以61%的收入份額領(lǐng)先基帶芯片市場。而目前,英偉達(dá)就基于其繁榮的生態(tài),構(gòu)筑了AMD暫時難以逾越的生態(tài)壁壘。

    綜上所述,我們認(rèn)為英偉達(dá)短期內(nèi)仍占AI芯片主導(dǎo)地位,主要基于如下原因:

    1)英偉達(dá)具備系統(tǒng)性集成競爭優(yōu)勢,GH200集合了Grace Hopper架構(gòu),并應(yīng)用第四代Tensor Core提升計算性能、進(jìn)行模型優(yōu)化,以及NVLink實現(xiàn)高速傳輸,這些系統(tǒng)性的優(yōu)化并不僅是部分硬件參數(shù)的提升所能比擬的,而這超異構(gòu)創(chuàng)新正是英偉達(dá)在硬件端的競爭壁壘,實現(xiàn)了芯片和系統(tǒng)耦合;

    2)CUDA具備ROCm難以企及的開發(fā)人員數(shù)量,而英偉達(dá)基于CUDA而形成的軟件生態(tài)的繁榮程度高于AMD的ROCm;

    3)MI300 X目前仍未送樣,距離實現(xiàn)量產(chǎn)可能也還有較長時間,仍需經(jīng)過產(chǎn)業(yè)實踐;而英偉達(dá)H100已在去年9月實現(xiàn)量產(chǎn),GH200目前也已投入量產(chǎn),上市時間指日可待;

    4)英偉達(dá)已形成了多元而龐大的客戶群和完備的合作伙伴網(wǎng)絡(luò),在其合作伙伴網(wǎng)絡(luò)列表中,截止2023年6月14日,共公示了976家公司,英偉達(dá)的客戶群和合作伙伴積淀暫時優(yōu)于AMD;

    5)研發(fā)人員的數(shù)量反映了公司長期的研發(fā)能力,隨著英偉達(dá)研發(fā)人員數(shù)量和研發(fā)投入的高增,我們看好后續(xù)英偉達(dá)產(chǎn)品的迭代速度。

    整體而言,AMD的MI 300系列產(chǎn)品作為全球AI算力的新供給,是AI算力增量市場有效補(bǔ)充,但暫時難以撼動英偉達(dá)的市場統(tǒng)治格局,推薦標(biāo)的英偉達(dá)(NVDA.O)。

    3

    風(fēng)險提示

    AI應(yīng)用發(fā)展不及預(yù)期;產(chǎn)品出貨時間不及預(yù)期;地緣政治沖突。

    來源:券商研報精選

    責(zé)任編輯:Rex_16

    關(guān)鍵詞:
    推薦閱讀

    直播電商選才靠升級打怪

    · 2023-06-16 07:41:07
    欧美国产在线一区,免费看成年视频网页,国产亚洲福利精品一区,亚洲一区二区约美女探花
    <bdo id="ks4iu"><del id="ks4iu"></del></bdo>
  • 
    <pre id="ks4iu"></pre>
  • <bdo id="ks4iu"><del id="ks4iu"></del></bdo>
    <input id="ks4iu"><em id="ks4iu"></em></input>
    
    
  • <center id="ks4iu"><cite id="ks4iu"></cite></center>
  • 主站蜘蛛池模板: 久久久久久久久久免免费精品| 哆啪啪免费视频| 亚洲AV无码乱码在线观看富二代| 91精品国产免费入口| 欧美综合亚洲图片综合区| 夜夜精品视频一区二区| 亚洲视频在线不卡| 999久久久无码国产精品| 欧美金发大战黑人video| 国产综合色在线精品| 亚洲图片欧美日韩| 亚洲黄色激情视频| 最好看的免费观看视频| 国产又粗又猛又爽视频| 久久久久亚洲精品无码网址色欲| 草草影院ccyy国产日本欧美| 日b视频在线观看| 午夜福利一区二区三区在线观看 | 久久久久久国产精品免费免费| 韩国日本好看电影免费看| 日日操夜夜操狠狠操| 四虎1515hh永久久免费| www夜片内射视频日韩精品成人| 深爱五月激情网| 国产精品天天看| 久久精品私人影院免费看| 老师开嫩苞在线观看| 宝宝你里面好烫很软不想出来 | 女人高潮内射99精品| 亚洲精品偷拍无码不卡av| 2019国产精品青青草原| 美女精品永久福利在线| 岛国a香蕉片不卡在线观看| 亚洲综合色区中文字幕| 永久在线观看www免费视频| 日韩精品一区二区三区中文3d| 国产一级一级一级国产片| www.成年人视频| 欧美波霸影院在线观看| 国产女合集六超多超嫩部| 中文字幕一二三四区2021|