亚洲国产日韩人妖另类,久久只有这里有精品热久久,依依成人精品视频在线观看,免费国产午夜视频在线

      
      

        英偉達(dá)最強(qiáng)芯片曝光:18176個(gè)內(nèi)核、48 GB內(nèi)存、24 Gbps速度和800W TBP

        英偉達(dá)最強(qiáng)芯片曝光:18176個(gè)內(nèi)核、48 GB內(nèi)存、24 Gbps速度和800W TBP

        來(lái)源:內(nèi)容由半導(dǎo)體行業(yè)觀察(ID:icbank)編譯自wccftech,謝謝。

        最近,博主Kopite7kimi報(bào)告了有關(guān)英偉達(dá)旗艦芯片 NVIDIA Ada Lovelace GPU SKU 的詳細(xì)信息,這使它看起來(lái)像是有史以來(lái)最強(qiáng)大的終極圖形芯片。傳聞指出,NVIDIA Ada Lovelace 旗艦 GPU 采用 AD102-450 GPU,具有 18176 個(gè)內(nèi)核、48 GB“24 Gbps”GDDR6X 顯存和 800W TBP.

        這不是第一次談?wù)撊绱烁叨说?Ada Lovelace GPU SKU。之前的傳言也來(lái)自同一個(gè)泄密者,它報(bào)道了 Ada Lovelace GPU 陣容中的 Titan-Class 顯卡,該顯卡具有一些瘋狂的規(guī)格。再一次,這不是完全啟用的 AD102 GPU,而之前的變體被提及為具有完整 18432 CUDA 內(nèi)核的 900W TBP SKU。

        根據(jù)傳聞的規(guī)格,該顯卡將采用 Ada Lovelace 架構(gòu)并具有略微縮減的配置“AD102-450-A1”,在 18,432 個(gè) CUDA 內(nèi)核(18432 個(gè) CUDA 中)上搖擺 142 個(gè) SM(144 個(gè) SM)核心)?;诖蠹s 3 GHz 的時(shí)鐘速度,這款顯卡將輕松突破 100 TFLOPs 計(jì)算障礙。據(jù)說(shuō)該顯卡配備 48 GB GDDR6X 內(nèi)存,運(yùn)行在 384 位總線接口上。

        有趣的是,NVIDIA 不會(huì)拘泥于 VRAM 規(guī)格,而是采用最新的 24 Gbps 內(nèi)存模塊,為 GPU 提供高達(dá) 1.152 TB/s 的 VRAM 帶寬。與具有 21 Gbps 內(nèi)存芯片的現(xiàn)有 RTX 3090 Ti 旗艦產(chǎn)品相比,內(nèi)存帶寬增加了 14%。即將推出的 RTX 4090 也有望使用相同的 21 Gbps 內(nèi)存芯片,只有旗艦“Ti”型號(hào)獲得 24 Gbps 芯片。

        功耗方面,新的NVIDIA旗艦AD102 GPU驅(qū)動(dòng)的顯卡將是瘋狂的,其TDP幾乎是RTX 3090 Ti的兩倍,額定功率高達(dá)800W??紤]到單個(gè) 16 針連接器只能提供 600 瓦的功率,如果它成為現(xiàn)實(shí),就必須為這種卡的怪物使用雙 16 針連接器配置。圖形卡可以使用 PG137-SKU0。

        基于 Ampere 陣容,我們看到 NVIDIA 不僅沒(méi)有發(fā)布 Titan 顯卡,而且實(shí)質(zhì)上用其 BFGPU 級(jí) GeForce RTX 陣容取代了 Titan 系列。更高容量的卡仍然作為工作站 RTX Axxx系列推出,它也得到了完整的 GA102 處理,但除了RTX 3090 Ti和RTX A6000之外,沒(méi)有 Titan 級(jí)。那么 Titan 級(jí) GPU 對(duì) Ada Lovelace 是否有意義,或者這個(gè)特定的 SKU 最終會(huì)成為下一代游戲 BFGPU 和工作站的旗艦產(chǎn)品嗎?好吧,我們不能肯定地說(shuō),但有一件事是絕對(duì)正確的,這樣的 GPU 配置在規(guī)格、功耗和價(jià)格方面確實(shí)是瘋狂的。該卡如果涉及零售,肯定會(huì)在RTX 4090之后推出預(yù)計(jì)將于今年秋季晚些時(shí)候亮相。

        Nvidia Ada Lovelace 和 GeForce RTX 40 系列:我們所知道的一切

        Nvidia 的 Ada 架構(gòu)和 GeForce RTX 40 系列顯卡預(yù)計(jì)將于今年年底上市,并且可能在 9 月至 10 月的時(shí)間范圍內(nèi)——發(fā)生在Nvidia Ampere 架構(gòu)之后的兩年,考慮到摩爾“定律”的放緩(或者如果你愿意,死亡),英偉達(dá)這個(gè)發(fā)布步驟基本上是按計(jì)劃進(jìn)行的。隨著今年早些時(shí)候的Nvidia 遭受黑客攻擊,我們獲得了關(guān)于預(yù)期結(jié)果的大量信息。我們已將所有內(nèi)容收集到這里,詳細(xì)介紹了我們對(duì) Nvidia 的 Ada 架構(gòu)和 RTX 40 系列家族的了解和期望。

        現(xiàn)在有很多謠言在流傳,但英偉達(dá)幾乎沒(méi)有透露其對(duì) Ada 的計(jì)劃,有些人將其稱(chēng)為 Lovelace。我們所知道的是,Nvidia 已經(jīng)詳細(xì)介紹了其數(shù)據(jù)中心Hopper H100 GPU,我們懷疑,就像Volta V100和Ampere A100一樣,消費(fèi)產(chǎn)品將在不久的將來(lái)跟進(jìn)。

        最后一個(gè)可能是預(yù)期的最佳樣本。A100 于 2020 年 5 月正式發(fā)布,消費(fèi)級(jí) Ampere GPU 以RTX 3080和RTX 3090的形式推出大約四個(gè)月后。如果 Nvidia Ada Lovelace GPU 遵循類(lèi)似的發(fā)布時(shí)間表,我們可以預(yù)期 RTX 40 系列將在 8 月或 9 月的某個(gè)時(shí)候到貨。讓我們從 Ada 系列 GPU 的傳聞規(guī)格的高級(jí)版本預(yù)覽開(kāi)始。

        首先,根據(jù)預(yù)計(jì),GPU 提供了介乎 1.6 到 2.0 GHz 的暫定時(shí)鐘速度估計(jì)值,這與 Nvidia 之前的 Ampere、Turing 甚至 Pascal 架構(gòu)一致。Nvidia 完全有可能超過(guò)這些時(shí)鐘,因此我們認(rèn)為這是一個(gè)保守的估計(jì)。

        我們假設(shè) Nvidia 將在所有 Ada GPU 上使用 TSMC 的 4N 工藝——“4nm Nvidia”,這在技術(shù)上可能又是不正確的。我們知道 Hopper H100 使用臺(tái)積電的 4N 節(jié)點(diǎn),這似乎主要是對(duì)臺(tái)積電 N5 節(jié)點(diǎn)的調(diào)整變體,該節(jié)點(diǎn)已廣泛用于蘋(píng)果的智能手機(jī)和筆記本電腦芯片,并且據(jù)傳聞,Nvidia 會(huì)將該節(jié)點(diǎn)用于 Ada。值得一提的是, AMD也有可能將其用于Zen 4 和RDNA 3。

        坦率地說(shuō),節(jié)點(diǎn)名稱(chēng)并不像實(shí)際的 GPU 規(guī)格和性能那么重要。換句話說(shuō),“任何其他名字的玫瑰都會(huì)聞起來(lái)很香”。我們?cè)缇瓦^(guò)了工藝節(jié)點(diǎn)名稱(chēng)與芯片上的物理特性有任何實(shí)際聯(lián)系的年代。在 250nm(或 0.25 微米)芯片實(shí)際上具有可以指向并以 0.25um 寬度進(jìn)行測(cè)量的元素時(shí),芯片的物理縮放在過(guò)去的幾個(gè)工藝節(jié)點(diǎn)上已經(jīng)放緩,它們現(xiàn)在只是營(yíng)銷(xiāo)名稱(chēng)。

        晶體管數(shù)量是目前最好的猜測(cè)。我們確實(shí)知道 Hopper H100 將擁有 800 億個(gè)晶體管(這實(shí)際上只是一個(gè)近似值,但我們會(huì)繼續(xù)使用它)。A100 GPU 有 560 億個(gè)晶體管,是 GA102 消費(fèi)級(jí) halo芯片數(shù)量的兩倍,但有跡象表明 Nvidia 將在 AD102 GPU 上“做大”,而且它的尺寸可能更接近 H100,而不是 GA102 . 如果有可靠的信息可用,我們將更新這些表格,但目前,任何關(guān)于晶體管數(shù)量的說(shuō)法都只是與我們不同的猜測(cè)。

        理論上,根據(jù)我們目前看到的“泄露”信息,Ada看起來(lái)是個(gè)怪物。與當(dāng)前的 Ampere GPU 相比,它將包含更多的 SM 和相關(guān)內(nèi)核,這將大大提高性能。即使 Ada 最終比泄漏所聲稱(chēng)的要少,可以肯定的是,我們會(huì)看到頂級(jí) GPU 的性能——也許是 RTX 4090,盡管 Nvidia 可能會(huì)再次改變命名法——不過(guò)毫無(wú)疑問(wèn),新產(chǎn)品將是領(lǐng)先RTX 3090 Ti 的一大進(jìn)步.

        例如,RTX 3080 在發(fā)布時(shí)比 RTX 2080 Ti 快了大約 30%,而 RTX 3090 又增加了 15%,至少如果你以 4K 超分辨率將 GPU 推到極限的話。這也是需要牢記的。如果您當(dāng)前運(yùn)行的是更適中的處理器,而不是絕對(duì)最好的游戲 CPU 之一(Core i9-12900K或Ryzen 7 5800X3D),這意味著即使在 1440p 超分辨率下,你也很可能會(huì)限制 CPU。為了充分利用最快的 Ada GPU,可能需要進(jìn)行更大的系統(tǒng)升級(jí)。

        在高級(jí)版本簡(jiǎn)介完畢之后,讓我們進(jìn)入細(xì)節(jié)。

        一 ADA 將大幅提升計(jì)算性能

        與當(dāng)前 Ampere 代相比,Ada GPU 最顯著的變化將是 SM 的數(shù)量。據(jù)猜測(cè),AD102 包含的 SM 可能比 GA102 多 71%。即使架構(gòu)沒(méi)有其他任何重大變化,我們也預(yù)計(jì)性能會(huì)大幅提高。

        這不僅適用于圖形,也適用于其他元素。我們?cè)?Tensor 核心性能上使用安培計(jì)算(Ampere calculations),運(yùn)行頻率接近 2GHz 的完全啟用的 AD102 芯片將在 FP16 中具有高達(dá) 590 TFLOPS 的深度學(xué)習(xí)/AI 計(jì)算。相比之下,RTX 3090 Ti 中的 GA102 最高約為 321 TFLOPS FP16(使用 Nvidia 的稀疏特性)。根據(jù)核心數(shù)量和時(shí)鐘速度,新產(chǎn)品理論上增加了 84%。理論上 84% 的性能提升同樣適用于光線追蹤硬件。

        除非 Nvidia 為各自的第三代和第四代實(shí)現(xiàn)重新設(shè)計(jì) RT 內(nèi)核和 Tensor 內(nèi)核。我們懷疑不需要對(duì) Tensor 內(nèi)核進(jìn)行大規(guī)模更改——Hopper H100 的深度學(xué)習(xí)硬件的重大改進(jìn)將比 Ada AD102 更多。同時(shí),RT 內(nèi)核可以很容易地看到每核 RT 性能比 Ampere 再提高 25-50% 的改進(jìn),就像 Ampere 每個(gè) RT 內(nèi)核比 Turing 快 75% 左右一樣。

        最壞的情況,只是將 Ampere 架構(gòu)從三星 Foundry 的 8N 工藝移植到 TSMC 的 4N(或 5N 或其他),并沒(méi)有真正改變架構(gòu)的任何其他內(nèi)容,添加更多內(nèi)核并保持類(lèi)似的時(shí)鐘應(yīng)該提供足夠的一代性能提升. Nvidia 的表現(xiàn)可能遠(yuǎn)遠(yuǎn)超過(guò)最低要求,但即使是位于底部的AD107 芯片也比當(dāng)前的 RTX 3050快30% 或更多的改進(jìn)。

        請(qǐng)記住,列出的 SM 數(shù)量是完整的芯片,而且很可能 Nvidia 將使用部分禁用的芯片來(lái)提高良率。以 Hopper H100 為例,它有 144 個(gè)潛在的 SM,但在 SXM5 變體上僅啟用了 132 個(gè) SM,而 PCIe 5.0 卡將啟用 114 個(gè) SM。我們可能會(huì)看到 Nvidia 推出高端 AD102 解決方案(即 RTX 4090),其中啟用了 132 到 140 個(gè) SM,較低層型號(hào)使用更少的 SM。在良率提高后,這當(dāng)然為未來(lái)帶有完全啟用 AD102 的卡(即 RTX 4090 Ti)打開(kāi)了大門(mén)。

        二 猜測(cè) ADA 的 ROP

        我們?cè)谒?Ada GPU 上的 ROP 計(jì)數(shù)(渲染輸出)之后加上了問(wèn)號(hào),因?yàn)槲覀冞€不知道它們是如何配置的。通過(guò) Ampere,Nvidia 將 ROP 與 GPC(圖形處理集群)聯(lián)系起來(lái)。每個(gè) GPC 包含一定數(shù)量的 SM(流式多處理器),可以成對(duì)禁用。然而,即使我們知道 SM 的數(shù)量,我們也不知道它們是如何分成 GPC 的。

        以帶有 144 個(gè) SM 的 AD102 為例。這可能是 12 個(gè) GPC,每個(gè) 12 個(gè) SM,8 個(gè) GPC,每個(gè) 18 個(gè) SM,或 9 個(gè) GPC,每個(gè) 16 個(gè) SM。其他可能性也存在,但這是我們認(rèn)為最有可能的三種。Nvidia 對(duì) GPU 游戲并不陌生,因此無(wú)論安排如何,最終我們都應(yīng)該期望它能夠滿足 GPU 的需求。

        我們已經(jīng)看到一些猜測(cè)表明 GA102 將有 12 個(gè) GPC,每個(gè) GPC 有 12 個(gè) SM,這將產(chǎn)生 192 個(gè) ROP 作為最大值。這不是不可能的,但請(qǐng)注意,Hopper H100 有 8 個(gè) GPC 集群,每個(gè)集群有 18 個(gè) SM,因此這對(duì)于 AD102 來(lái)說(shuō)似乎也是一個(gè)合理的配置——只是沒(méi)有 HBM3 并且較少關(guān)注深度學(xué)習(xí)硬件。

        三 可疑的泄密和謠言

        此外,AD102 的 144 個(gè) SM 是令人懷疑的。巧合的是,Hopper H100 芯片共有 144 個(gè) SM,其中 132 個(gè)在目前的頂級(jí)產(chǎn)品中啟用。對(duì)于 Ada 和 Hopper 都擁有相同的 144 個(gè) SM 來(lái)說(shuō),這將是非常令人驚訝的。GA100 最多有 120 個(gè) SM,因此,對(duì)于 H100,Nvidia 僅將 SM 數(shù)量增加了 20%。相比之下,假設(shè)泄密信息是真的,那就意味著AD102 的 SM 比 GA102 多 71%。

        我們現(xiàn)在沒(méi)有更好的事情要做,所以我們報(bào)道了傳聞中的 144 SM 數(shù)字,但如果這完全是假的,請(qǐng)不要感到驚訝。僅僅因?yàn)?Nvidia 被黑客入侵并且數(shù)據(jù)被泄露,并不意味著泄露的所有內(nèi)容都是準(zhǔn)確的。Nvidia 可能會(huì)更好地調(diào)整架構(gòu)以獲得更高的時(shí)鐘并使用更少的 SM,類(lèi)似于 AMD 對(duì) RDNA 2 所做的,但這可能需要對(duì)底層架構(gòu)進(jìn)行更重大的改革。

        另一方面,AD102 成為巨大芯片至少有一個(gè)充分的理由——專(zhuān)業(yè) GPU。Nvidia 并未為消費(fèi)者和專(zhuān)業(yè)市場(chǎng)制造完全獨(dú)立的芯片,RTX A6000 等 A 系列芯片就是明證。它使用與 RTX 3080 到 3090 Ti 相同的 GA102 芯片,只是在驅(qū)動(dòng)程序中打開(kāi)了一些額外的功能。光線追蹤并沒(méi)有真正讓游戲世界著火,但它對(duì)專(zhuān)業(yè)市場(chǎng)來(lái)說(shuō)是一件大事,并且封裝更多的 RT 核心將是 3D 渲染用戶(hù)的福音。另請(qǐng)注意,Hopper H100 不包含任何光線追蹤硬件,就像它所取代的 GA100 一樣。

        各種 Ada GPU 也將用于運(yùn)行 AI 和 ML 算法的推理平臺(tái),這再次意味著可以使用更多的 Tensor 內(nèi)核和計(jì)算。因此,最重要的是,假設(shè)的最大 144 個(gè) SM 并不是完全不可能的,但它肯定值得懷疑。也許英偉達(dá)黑客發(fā)現(xiàn)了過(guò)時(shí)的信息,或者人們錯(cuò)誤地解釋了它。在接下來(lái)的幾個(gè)月里,我們會(huì)知道更多。

        四 內(nèi)存子系統(tǒng):GDDR6X 再上新臺(tái)階

        早前,美光宣布它擁有運(yùn)行速度高達(dá) 24Gbps 的 GDDR6X 內(nèi)存的路線圖。最新的 RTX 3090 Ti 僅使用 21Gbps 內(nèi)存,而 Nvidia 是目前唯一一家使用 GDDR6X 的公司。這立即引發(fā)了將使用 24Gbps GDDR6X 的問(wèn)題,唯一合理的答案似乎是 Nvidia Ada。較低層的 GPU 更有可能堅(jiān)持使用標(biāo)準(zhǔn) GDDR6 而不是 GDDR6X,其最高速度為 18Gbps。

        這代表了一個(gè)問(wèn)題,因?yàn)?GPU 通常需要計(jì)算和帶寬來(lái)按比例擴(kuò)展以實(shí)現(xiàn)承諾的性能量。例如,RTX 3090 Ti 的計(jì)算量比 3090 多 12%,更高的時(shí)鐘內(nèi)存提供了 8% 的帶寬。如果我們上面的計(jì)算估計(jì)證明甚至接近準(zhǔn)確,那么就會(huì)出現(xiàn)巨大的脫節(jié)。假設(shè)的 RTX 4090 的計(jì)算量可能比 RTX 3090 Ti 多 80%,但帶寬僅多 14%。

        假設(shè)可以控制 GDDR6X 功耗,那么在較低級(jí)別的GPU 上帶寬增長(zhǎng)的空間要大得多。當(dāng)前的 RTX 3050 到 RTX 3070 都使用標(biāo)準(zhǔn) GDDR6 內(nèi)存,主頻為 14-15Gbps。我們已經(jīng)知道運(yùn)行在 18Gbps 的 GDDR6 將及時(shí)為 Ada 提供,因此具有 18Gbps GDDR6 的假設(shè) RTX 4050 應(yīng)該可以輕松跟上 GPU 計(jì)算能力的增長(zhǎng)。如果 Nvidia 仍然需要更多帶寬,它也可以將 GDDR6X 用于較低層的 GPU。

        更高級(jí)別的 Ada GPU 最終與 GDDR7 或三星的“GDDR6+”配對(duì)的可能性也很小,據(jù)報(bào)道,這將達(dá)到高達(dá) 27Gbps 的速度。然而,我們還沒(méi)有聽(tīng)到關(guān)于其中任何一個(gè)的具體細(xì)節(jié),在這個(gè)階段,Nvidia 將需要其合作伙伴來(lái)提高內(nèi)存產(chǎn)量。更多的生產(chǎn)將不可避免地導(dǎo)致更多的泄漏,由于我們還沒(méi)有看到 GDDR7 或 GDDR6+ 生產(chǎn)的泄漏,我們假設(shè)它不會(huì)及時(shí)出現(xiàn)。

        更有可能的是,Nvidia不需要大幅增加純內(nèi)存帶寬,因?yàn)樗鼤?huì)重新設(shè)計(jì)架構(gòu),類(lèi)似于我們看到 AMD 對(duì) RDNA 2 所做的與原始 RDNA 架構(gòu)相比。

        五 ADA 希望利用 L2 緩存獲利

        一種減少對(duì)更多原始內(nèi)存帶寬需求的好方法是幾十年來(lái)已知和使用的方法——在芯片上增加更多緩存,您會(huì)獲得更多cache hits,每次cache hits意味著 GPU 不需要從 GDDR6/GDDR6X 內(nèi)存中提取數(shù)據(jù)。AMD 的 Infinity Cache 讓 RDNA 2 芯片基本上可以用更少的原始帶寬做更多的事情,泄露的Nvidia Ada L2 緩存信息表明 Nvidia 將采取類(lèi)似的方法。

        AMD 在 Navi 21 GPU 上使用了高達(dá) 128MB 的大型 L3 緩存,Navi 22 為 96MB,Navi 23 為 32MB,Navi 24 僅為 16MB。令人驚訝的是,即使是較小的 16MB 緩存也能為內(nèi)存子系統(tǒng)帶來(lái)奇跡。我們沒(méi)想到Radeon RX 6500 XT總的來(lái)說(shuō)是一張很棒的卡,但它基本上可以跟上內(nèi)存帶寬幾乎是兩倍的卡。

        Ada 架構(gòu)似乎將一個(gè) 8MB L2 緩存與每個(gè) 32 位內(nèi)存控制器配對(duì)。這意味著具有 128 位內(nèi)存接口的卡將獲得 32MB 的總二級(jí)緩存,而堆棧頂部的 384 位接口卡將擁有 96MB 的二級(jí)緩存。雖然在某些情況下這比 AMD 的 Infinity Cache 要小,但我們還不知道延遲或設(shè)計(jì)的其他方面。L2 緩存的延遲往往低于 L3 緩存,因此稍小的 L2 肯定可以跟上更大但速度較慢的 L3 緩存。

        如果我們以 AMD 的 RX 6700 XT 為例,它的計(jì)算能力比上一代 RX 5700 XT 高出約 35%。我們的GPU 基準(zhǔn)測(cè)試層次結(jié)構(gòu)中的性能同時(shí)在 1440p 超分辨率下高出約 32%,因此整體性能與計(jì)算幾乎一致。除此之外,6700 XT 擁有 192 位接口,帶寬僅為 384 GB/s,比 RX 5700 XT 的 448 GB/s 低 14%。這意味著大型 Infinity Cache 使 AMD 的有效帶寬提高了 50%。

        假設(shè) Nvidia 可以通過(guò) Ada 獲得類(lèi)似的結(jié)果,那么通過(guò) 24Gbps 內(nèi)存將帶寬增加 14%,然后將其與有效帶寬增加 50% 配對(duì)。這將使 AD102 的有效帶寬增加大約 71%,這與 GPU 計(jì)算的增加非常接近,因此一切都應(yīng)該很好地發(fā)揮作用。

        然而,關(guān)于緩存謠言的更多都是猜測(cè)。Nvidia 已經(jīng)發(fā)布了有關(guān) Hopper H100 的大量細(xì)節(jié)。它確實(shí)比上一代 GA100 具有更大的 L2 緩存大小,但它不是每個(gè)內(nèi)存控制器 8MB。事實(shí)上,H100 上的總二級(jí)緩存為 50MB,而 A100 的二級(jí)緩存為 40MB。但 Hopper 也使用 HBM3 顯存,將用于海量數(shù)據(jù)集,這也是它擁有 80GB 顯存的原因。任何不能放入 40MB 的東西也不太可能放入 50MB 甚至 150MB。消費(fèi)者工作負(fù)載,尤其是游戲,更有可能從更大的緩存中受益。Nvidia 可能會(huì)在這里追隨 AMD 的腳步,或者謠言最終可能完全錯(cuò)誤。

        六 ADA的功耗

        Ada 架構(gòu)的一個(gè)元素肯定會(huì)引起一兩個(gè)人的注意,那就是功耗。Igor’s Lab 的 Igor 是第一個(gè)將 Ada 的 600W TBP(典型電路板功率)傳聞?dòng)涗浽诎傅娜?,我們第一次?tīng)到就笑了?!安豢赡?,”我們想。多年來(lái),Nvidia 顯卡的最高功率接近 250W,而 Ampere 在 RTX 3090(以及后來(lái)的 RTX 3080 Ti)上躍升至 350W 已經(jīng)感覺(jué)有些過(guò)分了。隨后英偉達(dá)公布了 Hopper H100 規(guī)格并發(fā)布了 RTX 3090 Ti,突然覺(jué)得 600W 的可能性不大。

        這一切都可以追溯到 Dennard scaling的終結(jié),以及摩爾定律的死亡。簡(jiǎn)而言之,Dennard scaling(也稱(chēng)為 MOSFET scaling)觀察到,每一代,尺寸都可以縮小約 30%。這將總面積減少了 50%(長(zhǎng)度和寬度都按比例縮放),電壓下降了類(lèi)似的 30%,電路延遲也將減少 30%。此外,頻率將增加約 40%,總功耗將減少 50%。

        如果這一切聽(tīng)起來(lái)好得令人難以置信,那是因?yàn)?Dennard scaling實(shí)際上在 2007 年左右停止發(fā)生。就像摩爾定律一樣,它并沒(méi)有完全失效,但收益變得不那么明顯了。集成電路中的時(shí)鐘速度僅從 2004 年 Pentium 4 Extreme Edition 的最高約 3.7GHz 增加到如今 Core i9-12900KS 的最高 5.5GHz。這仍然幾乎增加了 50% 的頻率,但它已經(jīng)超過(guò)了六代(或更多,取決于您要如何計(jì)算)的流程節(jié)點(diǎn)改進(jìn)。換句話說(shuō),如果 Dennard scaling沒(méi)有死,現(xiàn)代 CPU 的時(shí)鐘頻率將高達(dá) 28GHz。

        死亡的不僅僅是頻率縮放,還有功率和電壓縮放。如今,新的工藝節(jié)點(diǎn)還可以提高晶體管密度,不過(guò)需要平衡電壓和頻率。如果您想要一個(gè)速度快兩倍的芯片,您可能需要使用幾乎兩倍的功率。或者,您可以構(gòu)建更高效的芯片,但不會(huì)更快。Nvidia 似乎正在尋求 Ada 的第一個(gè)選項(xiàng)。

        使用像 GA102 這樣的 350W Ampere GPU,將性能提升 70-80%。因此,這樣做意味著要多使用 70-80% 的功率。350W 然后變成 595–630W。Nvidia 可能會(huì)比線性擴(kuò)展稍微好一點(diǎn),并且 600W 很可能是參考卡上的最大功率使用,但我們已經(jīng)聽(tīng)說(shuō)一些下一代第三方超頻卡可能包括雙 16 針電源連接器。

        七 ADA會(huì)最終成為RTX 40-SERIES嗎?

        下一代Nvidia GPU將被稱(chēng)為什么仍然存在問(wèn)題。我們建議 RTX 40 系列,堅(jiān)持過(guò)去幾代人建立的模式,但 Nvidia 總能改變一些事情。改變的一個(gè)潛在原因是:中國(guó)人不喜歡“四”,這在粵語(yǔ)和普通話中也意味著死亡。

        這是一個(gè)足夠好的理由來(lái)改變事情嗎?也許不是。當(dāng)然,這些年來(lái)我們已經(jīng)看到很多顯卡和其他型號(hào)為“4”的 PC 產(chǎn)品。英偉達(dá)在其 RTX 品牌上投入了大量資金,雖然如果每個(gè)人都準(zhǔn)確地猜出下一系列 GPU 的名稱(chēng)可能不會(huì)那么令人興奮,但銷(xiāo)量才是最重要的。

        無(wú)論最終調(diào)用 Ada 顯卡,都不會(huì)改變它們的性能或功能。我們中的大多數(shù)人有理由相信 Nvidia 將使用 RTX 40 系列名稱(chēng),但如果 Nvidia 做出改變,這并不是世界末日。

        簡(jiǎn)短的答案,也是真正的答案是,它們的成本將與 Nvidia 可以擺脫的收費(fèi)一樣多。Nvidia 推出 Ampere 時(shí)采用了一套財(cái)務(wù)模型,但事實(shí)證明,這些模型在 Covid-19 大流行時(shí)代是完全錯(cuò)誤的。現(xiàn)實(shí)世界的價(jià)格飆升,黃牛從中牟取暴利,而那是在加密貨幣礦工開(kāi)始支付官方推薦價(jià)格的兩到三倍之前。即使是現(xiàn)在,我們?nèi)匀豢吹?30% 或更多的加價(jià)。好消息是GPU 價(jià)格正在下降。

        Ada 和 RTX 40 系列的 GPU 價(jià)格很可能會(huì)上漲。然而,假設(shè)的大型 L2 緩存和內(nèi)存帶寬的相對(duì)有限增加應(yīng)該導(dǎo)致 Ada 僅在 Ampere 的采礦性能方面提供適度的提升,就像 AMD 的 RDNA 2 卡僅比 RDNA 模型快一點(diǎn)一樣。這意味著,即使在 Ada 到來(lái)之前采礦盈利能力“恢復(fù)”,單靠采礦幾乎肯定無(wú)法維持我們從 2020 年底到 2022 年初看到的大幅上漲的價(jià)格。

        正如我們將在下一節(jié)中討論的那樣,Nvidia 也沒(méi)有理由立即將其所有 GPU 生產(chǎn)從 Ampere 轉(zhuǎn)移到 Ada。我們可能會(huì)看到 RTX 30 系列 GPU 仍在生產(chǎn)相當(dāng)長(zhǎng)一段時(shí)間,特別是因?yàn)闆](méi)有其他 GPU 或 CPU 競(jìng)爭(zhēng)三星 Foundry 的 8N 制造。Nvidia 首先推出高端 Ada 卡,利用其可以從臺(tái)積電獲得的所有可用容量,并在必要時(shí)降低現(xiàn)有 RTX 30 卡的價(jià)格以填補(bǔ)任何漏洞,從而獲得更多收益。

        我們多次提到了 9 月推出 Ada 和 RTX 40 系列 GPU 的時(shí)間表,但重要的是要記住,第一批 Ada 卡只是冰山一角。英偉達(dá)于 2020 年 9 月推出了 RTX 3080 和 RTX 3090,一個(gè)月后 RTX 3070 到貨,再過(guò)一個(gè)月后 RTX 3060 Ti 到貨。RTX 3060 直到 2021 年 2 月下旬才問(wèn)世,然后 Nvidia 在 2021 年 6 月用 RTX 3080 Ti 和 RTX 3070 Ti 更新了該系列。預(yù)算友好的 RTX 3050 直到 2022 年 1 月才到貨,最后是 RTX 3090 Ti 剛剛于 2022 年 3 月下旬推出。

        我們預(yù)計(jì) Ada 卡也將分階段推出,從最快的型號(hào)開(kāi)始逐步進(jìn)入高端和主流產(chǎn)品,以預(yù)算為導(dǎo)向的 AD106 和 AD107 最早可能要到 2023 年才會(huì)推出。正如我們剛剛提到的,RTX 3050 僅在 1 月下旬推出,因此至少再過(guò)一年甚至更長(zhǎng)的時(shí)間都不會(huì)更換。再說(shuō)一次,我們?nèi)匀恍枰嬲念A(yù)算產(chǎn)品來(lái)接管 GTX 1660 和 GTX 1650 系列。我們能否以低于 200 美元的價(jià)格獲得新的 GTX 系列或真正的預(yù)算 RTX 卡?這是可能的,但不要指望它,因?yàn)?Nvidia 似乎滿足于讓 AMD 和英特爾在 200 美元以下的范圍內(nèi)與之抗衡。

        在首次發(fā)布大約一年后,不可避免地會(huì)更新 Ada 產(chǎn)品。在這個(gè)階段,任何人都猜測(cè)這些最終是“Ti”模型還是“Super”模型或其他什么,但你幾乎可以在你的日歷上標(biāo)記它。

        八 GPU世界的更多競(jìng)爭(zhēng)

        幾十年來(lái),英偉達(dá)一直是顯卡領(lǐng)域的主導(dǎo)者。它控制著整個(gè) GPU 市場(chǎng)的大約 80% 到 90%,并且在很大程度上能夠決定光線追蹤和 DLSS 等新技術(shù)的創(chuàng)建和采用。然而,隨著人工智能和計(jì)算對(duì)科學(xué)研究和其他計(jì)算工作負(fù)載的重要性不斷增加,以及它們對(duì)類(lèi)似 GPU 的處理器的依賴(lài),許多其他公司都在尋求進(jìn)入該行業(yè),其中最主要的是英特爾。

        自 90 年代后期以來(lái),英特爾就沒(méi)有在專(zhuān)用顯卡上做出過(guò)適當(dāng)?shù)膰L試,除非你算上流產(chǎn)的 Larrabee。這一次,Intel Arc 似乎是玩真的——或者至少是進(jìn)了門(mén)??雌饋?lái)英特爾更多地關(guān)注媒體功能,而在 Arc 的游戲或一般計(jì)算性能方面,陪審團(tuán)仍然沒(méi)有定論。據(jù)我們所知,頂級(jí)消費(fèi)模型最多只能在 18 TFLOPS 范圍內(nèi)??纯次覀?cè)陧敳康淖雷?,看起?lái)它只會(huì)與 AD106 競(jìng)爭(zhēng)。

        但 Arc Alchemist 只是英特爾計(jì)劃的常規(guī) GPU 架構(gòu)中的第一個(gè)。Battlemage 可以輕松地將 Alchemist 的能力翻倍,如果英特爾能夠早日實(shí)現(xiàn)這一目標(biāo),它可能會(huì)開(kāi)始蠶食 Nvidia 的市場(chǎng)份額,尤其是在游戲筆記本電腦領(lǐng)域。

        AMD 也不會(huì)停滯不前,它已經(jīng)多次表示它“有望”在今年年底之前推出其 RDNA 3 架構(gòu)。我們預(yù)計(jì) AMD 將轉(zhuǎn)向臺(tái)積電的 N5 節(jié)點(diǎn),這意味著它可能會(huì)直接與 Nvidia 競(jìng)爭(zhēng)晶圓,并且兩者都必須做出類(lèi)似的設(shè)計(jì)決策。到目前為止,AMD 一直避免將任何形式的深度學(xué)習(xí)硬件放入其消費(fèi)級(jí) GPU(與其 MI200 系列不同),但由于 Arc 還包括 Xe Matrix 內(nèi)核,它可能需要重新考慮這種方法。

        毫無(wú)疑問(wèn),Nvidia 目前提供的光線追蹤性能遠(yuǎn)遠(yuǎn)優(yōu)于 AMD 的 RX 6000 系列卡,但 AMD 對(duì)光線追蹤硬件或游戲中對(duì) RT 效果的需求幾乎沒(méi)有直言不諱。就英特爾而言,它的 RT 性能似乎比 AMD 還要低。但只要大多數(shù)游戲在沒(méi)有 RT 效果的情況下繼續(xù)運(yùn)行得更快并且看起來(lái)不錯(cuò),那么說(shuō)服人們升級(jí)顯卡就是一場(chǎng)艱苦的戰(zhàn)斗。

        長(zhǎng)達(dá)兩年的 GPU 干旱和價(jià)格過(guò)高的顯卡已經(jīng)過(guò)去了。2022 年將成為自 2020 年以來(lái) GPU 領(lǐng)域的第一次真正激動(dòng)人心的時(shí)刻。希望這一輪能夠看到更好的可用性和定價(jià)。它幾乎不會(huì)比我們過(guò)去 18 個(gè)月看到的情況更糟。

        參考鏈接:

        NVIDIA Flagship “Ada Lovelace” GPU Rumored To Feature 18176 Cores, 48 GB Memory, 24 Gbps Speeds & 800W TBP

        https://www.tomshardware.com/features/nvidia-ada-lovelace-and-geforce-rtx-40-series-everything-we-know

        *免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表半導(dǎo)體行業(yè)觀察對(duì)該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。

        今天是《半導(dǎo)體行業(yè)觀察》為您分享的第3112內(nèi)容,歡迎關(guān)注。

        晶圓 集成電路 設(shè)備 汽車(chē)芯片 存儲(chǔ) 臺(tái)積電 AI 封裝

        鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場(chǎng),版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。
        上一篇 2022年7月27日 15:14
        下一篇 2022年7月27日 15:14

        相關(guān)推薦

        聯(lián)系我們

        聯(lián)系郵箱:admin#wlmqw.com
        工作時(shí)間:周一至周五,10:30-18:30,節(jié)假日休息