显卡30系列深度解析（上篇）

时间：10-27 神话故事提交错误

大家好，显卡30系列深度解析（上篇）相信很多的网友都不是很明白，包括也是一样，不过没有关系，接下来就来为大家分享关于显卡30系列深度解析（上篇）和的一些知识点，大家可以关注收藏，免得下次来找不到哦，下面我们开始吧！

学号：20021210601 姓名：魏素恒

【嵌入式牛介绍】NVIDIA新一代30系列显卡简析。

【嵌入式牛鼻子】RTX3070 RTX3080 RTX3090

【嵌入牛文】

在当前的显卡市场上，占据80%份额的NVIDIA让玩家们又爱又恨。他们带来了近十年来最好的显卡，也让高端游戏卡的价格不断上涨。现在RTX 3090 起价为五位数。

RTX 30系列显卡发布后，玩家的不满似乎得到了缓解。与目前的图灵显卡相比，基于Ampere的RTX

3090/3080/3070显卡突然变得非常受欢迎，因为它们不仅性能翻倍，而且国内价格居然下降了。

·GeForce RTX 3090：取代RTX Titan，与Titan相比

RTX 速度提升50%，性能是RTX 2080 Ti 显卡的两倍。配备24GB GDDR6X显存，售价11999元，9月24日上市。

·GeForce RTX 3080：取代RTX 2080 Ti，与RTX相比

2080的性能提升2倍，配备10GB GDDR6X显存。海外699美元价格没有变化，但国内价格从上一代的6499元降至5499元。将于9月17日上线。

GeForce RTX 3070：价格不到RTX 2080 Ti 的一半，但平均性能更高，比RTX 2070 快整整60%，配备8GB

GDDR6显存售价3899元，将于10月份上市。

RTX30系列显卡价格及上市时间

RTX30系列显卡性能变化

RTX

30系列显卡规格

从这张规格表中可以看出，与RTX 2080 Ti显卡相比，RTX 3090标志性的FP32性能从13.4T提升到35.7T，增加了一倍多，并且在光追和AI加速方面的提升也很明显。

与Turing显卡相比，Ampere GPU的变化令人惊讶。在过去十年的显卡升级中，性能翻倍的情况并不多见。英伟达是如何做到的？

今天我们就来详细讲解Ampere GPU的架构，探究它带来了哪些被NVIDIA创始人黄仁勋称为史上最大的性能提升的技术升级。

先从工艺说起：12nm秒杀7nm后，8nm如何进一步发展？

对于半导体芯片来说，关键的一环就是工艺技术。先进的架构也必须通过技术来实现。这是影响芯片能效、性能甚至成本的主要因素。

对于NVIDIA来说，他们的Volta和Turing架构都是基于台积电的12nm FFN工艺，这是台积电16nm工艺的改进版本。如果算上16nm Pascal架构的话，其实过去三代GPU并没有产生什么明显的影响。该流程已升级。

在Ampere架构上，NVIDIA终于升级了工艺，不过这次有两个惊喜。首先，——没有选择台积电，其次，它没有选择7nm，而是三星定制的8nm工艺。虽然看起来和7nm只有1nm的差别，但实际上是两代工艺。

考虑到NVIDIA此前在技术上的立场，预计将采用三星的8nm工艺，而不是7nm工艺。最关键的问题是NVIDIA 能做得如何。

三星的8nm工艺是在10nm工艺基础上的改进。至少有两个版本：LPP 和LPU。前者适用于移动SoC，后者适用于高性能芯片。 NVIDIA的定制很可能是基于后者。

与台积电7nm工艺晶体管密度约1亿个/mm2相比，8nm工艺约6000万个晶体管/mm2，但这是单个SRAM芯片的比较。事实上，GPU芯片更复杂，差距会小很多。

根据NVIDIA公布的信息，台积电7nm工艺制造的Ampere A100核心拥有540亿个晶体管，核心面积为826mm2，而三星8nm工艺制造的GA102核心拥有280亿个晶体管。核心区尚未正式公布。据悉，其尺寸为628mm2，同样是大芯。

以此计算，7nm A100核心的晶体管密度为6560万个晶体管/mm2，而三星的8nm GA102核心也有4460万个晶体管/mm2。差距仍然存在，但似乎可以接受。

三星8nm工艺的晶圆代工价格目前仍是一个秘密，但从技术和商业策略来看，三星会比台积电便宜很多。预计代工价差将达到30%甚至更高，所以这也是RTX 30系列显卡无法涨价的原因。甚至是降价的关键。

那么三星8nm工艺带来了多大的性能和能效提升呢？首先可以看到RTX 30系列显卡的频率有所提升，从RTX 20系列的1.5GHz+提升到了1.7GHz+。升级后的工艺提高了性能。

不过RTX 20系列的加速频率实际上可以达到1.9GHz甚至接近2GHz，而RTX 30系列预计也会达到这个水平。

然而，能源效率得到了提高。 NVIDIA官方宣称，在60fps性能下，图灵显卡的功耗约为240W，安培显卡的功耗则在120W以上。算下来，是能源效率的1.9倍，提升了90%，而且温度也更低。 3度，噪音降低2分贝。

总体来说，在工艺方面，大家对于Ampere GPU是既惊讶又失望。令人失望的是，它没有预期的7nm工艺（无论台积电还是三星），工艺仍然升级到8nm。

不过，NVIDIA的工艺虽然不算激进，但性能和能效却有了很大的提升。安培显卡各方面都明显优于现在的图灵卡，而且价格不升反降。这也不是追求激进的技术。优点是12nm无论如何都能赢，但现在上8nm更有把握。

Ampere GPU架构详解：FP32单元加倍CUDA核心，有什么变化？

Ampere发布时，NVIDIA首席执行官黄仁勋表示，这是GPU历史上最大的性能飞跃。 2018年图灵GPU推出时，黄仁勋也同样表示，—— GPU是史上最大的改变。这两个评价其实都是正确的。

图灵GPU架构有很多第一。首次支持RTX Core（光追加速单元），首次支持Tensor Core，还改进了CUDA内核，但前两者才是重点。

在Ampere GPU、RT Core、Tensor 上

当然，Core还在继续加强，但主要亮点还是CUDA架构的改进。性能倍增的根源就在这里。我们先来看看这方面的变化。

GA102核心架构图

GA102核心共有7组GPC单元，每组有12组SM单元，总共84组。 RTX 30系列显卡中启用的SM单元总数取决于不同的规格。 RTX 3090有82组，RTX 3080有68组，RTX 30系列显卡有82组。

3070是46组。

在之前的GA100核心中，每组SM由64个INT32单元、64个FP32单元和32个FP64单元组成。不过在GA102核心中，FP64单元大幅减少，增加了RT Core，Tensor Core也略有减少。

GA102核心SM单元

沿袭了之前的Turing GPU路线，Ampere GPU的SM单元并没有增加太多，但实际上FP32性能却提升了一倍多。算上频率，RTX 3080的理论性能几乎是RTX 2080的三倍。这是怎么做到的呢？

答案是把CUDA核心的FP32加倍，但是加倍的方法有点特殊。每个SM单元有4个分区，除了第三代Tensor之外的每个分区

除了Core核心之外，还有一组16个FP32单元、16个FP32单元、16个IN32单元。后者可以同时执行FP32 或INT32 操作。

16个FP32单元每个周期可以执行16个FP32操作，混合单元可以执行32个FP32或16个FP32+16个INT32。

这样，每个SM单元可以同时执行4x（16FP32+16FP32）=128 FP32操作，或者4x（16FP32+16INT32）=64 FP32 + 64 INT32操作。

如果只算FP32浮点数的话，那么浮点数就翻倍了，因为Turing和GA100每个周期只有64个FP32浮点数，现在可以做128个FP32运算。

提高FP32 性能对于游戏和计算都有很大好处，但也需要配套的改进。 GA102的L1容量提升了33%，L1带宽翻倍，从116GB/s提升到219GB/s，共享内存性能也从116GB/s提升到219GB/s。 64B 翻倍为128B。

Ampere GPU架构详解：RTX光线追踪从可用到易用升级

上一代图灵GPU架构的最大亮点就是RTX实时光线追踪技术的引入，开启了3D游戏的光线追踪时代，意义重大。

不过，做先锋的代价也不小，图灵GPU的光线追踪效果在实际游戏中并不明显，对性能影响很大。第一代RTX 光线追踪只能说是解决了问题，而目前的Ampere GPU 更有用的是RTX 光线追踪。

在Turing GPU 上，NVIDIA 使用的第一代RT

Core可以提供10Giga Rays/s的性能，并且在Ampere GPU上，RT Core已经升级到第二代，号称性能提升一倍。仅此一点就可以极大地提高光追踪性能。

图灵GPU光追架构

Ampere GPU 光追踪

但这还不够。在Ampere GPU上，参与光追应用加速的不仅仅是SM单元和RT单元。第三代Tensor Core单元也参与更多。 Ampere架构中的SM、RT、Tensor单元的性能均得到了大幅提升。以RTX 3080为例，SM单元性能从11T提升到30T，RT性能从上一代34T提升到58T，Tensor性能从89暴涨到238T。

这样做的结果之一是光追踪性能得到了极大的提高。不支持硬件加速的Pascal GPU 渲染一帧需要51 毫秒。图灵可以将其增加到19ms。通过DLSS，可以缩短到13ms，这已经比60fps的要求低很多了。 16.6 毫秒帧时间。

在Ampere GPU 上，时间甚至可以更快。仅硬件加速即可从13ms缩短至7.5ms。加上第二代技术后，仅为6.7ms。

总之，就RT光追性能而言，别说没有硬件加速的Pascal显卡，相比RTX 2080到RTX 3080的变化，软件渲染的性能提升了40%，有硬件加速的情况下提升了70%，硬件加速+DLSS也得到了提升。 70%，加上其他技术的辅助，光追性能最高可提升90%。

显卡30系列深度解析（上篇）和的问题分享结束啦，以上的文章解决了您的问题吗？欢迎您下次再来哦！

用户评论

纯情小火鸡

最近想升级显卡，感觉30系列蛮火的

有11位网友表示赞同！

拥抱

30系一直是我的心头好，性能强悍啊！

有9位网友表示赞同！

古巷青灯

等不及想知道哪个型号更适合我呢

有17位网友表示赞同！

颜洛殇

看标题应该是针对玩游戏的吧，30系对游戏体验影响很大啊。

有8位网友表示赞同！

从此我爱的人都像你

希望这篇文章能简单直白的讲解一下每个型号的特点

有18位网友表示赞同！

煮酒

之前一直没弄清楚30系的命名规则，希望这篇分析能搞懂。

有9位网友表示赞同！

▼遗忘那段似水年华

学习一下30系显卡的优缺点，以便下决策呢！

有13位网友表示赞同！

容纳我ii

文章能否对比一下不同型号的性能提升？

有15位网友表示赞同！

厌归人

对新手入门的朋友来说，一篇浅析正好合适！

有17位网友表示赞同！

来瓶年的冰泉

期待看到30系的最新动态和分析！

有5位网友表示赞同！

孤廖

看标题感觉这个“前”应该是分两批写吧？后半部分也值得期待！

有16位网友表示赞同！

余温散尽ぺ

希望这篇文章能涵盖30系的主要型号，方便我比较选择！

有9位网友表示赞同！

无寒

我的电脑配置有点老了，wondering if 30 series would be a big upgrade ?

有8位网友表示赞同！

妄灸

想了解一下30系显卡的性价比怎么样？

有12位网友表示赞同！

心安i

文章能不能简单介绍一下30系的功耗和散热情况呢？

有17位网友表示赞同！

猫腻

我的预算有限，不知道可以选择哪些型号。希望这篇文章能给我一些建议！

有15位网友表示赞同！

枫无痕

最近听说30系显卡的驱动比较稳定了？是真的吗？

有12位网友表示赞同！

揉乱头发

除了游戏性能，30系显卡还能用于什么场景呢？

有14位网友表示赞同！

ヅ她的身影若隐若现

对于专业用途来说，30系显卡怎么样？

有6位网友表示赞同！

咆哮

期待看到这篇对30系显卡的详细浅析！

有14位网友表示赞同！

【显卡30系列深度解析（上篇）】相关文章：

1.动物故事精选：寓教于乐的儿童故事宝库

2.《寓教于乐：精选动物故事助力儿童成长》

3.探索动物旅行的奇幻冒险：专为儿童打造的童话故事

8.狮子与猫咪的奇妙邂逅：一场跨界的友谊故事

9.揭秘情感的力量：如何影响我们的生活与决策

10.跨越两岸：探索彼此的独特世界

免责声明：部分作品来自网友发布，或收集于互联网，目的在于更好的传递好内容 ,正能量内容。如果侵犯了您的权益，或者您不想在本站发布，请及时联系我们，我们第一时间删除信息！

上一篇：《金刚经》独特解读（上篇）下一篇：揭秘天猫返利：十大热门高佣返利APP推荐，返利哪家强？

热门故事查看更多>

民间传说故事04-10一年级小故事注音版
故事会04-10农夫与蛇的故事说明了什么,农夫与蛇的故事告诉我们什么意思
故事会04-10农夫与蛇的故事说明【农夫与蛇的故事说明什么道理】
故事会04-10农夫与蛇的故事视频,农夫与蛇的故事视频小学
名人励志轶事04-10儿童故事在线听讲,儿童睡前听的故事
故事会04-10农夫与蛇的故事寓意视频农夫与蛇的故事的寓意
故事会04-10农夫与蛇的故事寓意和道理(农夫与蛇的故事寓意和道理怎么写)
故事会04-10农夫与蛇的故事寓意告诉我们什么道理、农夫与蛇的故事寓意告诉我们什么道理英语

显卡30系列深度解析（上篇）

用户评论

三只小猪简短故事三只小猪简短故事内容

农夫与蛇的道理10字—农夫与蛇的道理10字怎么写

农夫与蛇的道理-克雷洛夫寓言中农夫与蛇的道理

农夫与蛇的故事道理—农夫与蛇的故事道理10字怎么写

显卡30系列深度解析（上篇）

用户评论

三只小猪简短故事 三只小猪简短故事内容

农夫与蛇的道理10字—农夫与蛇的道理10字怎么写

农夫与蛇的道理-克雷洛夫寓言中农夫与蛇的道理

农夫与蛇的故事道理—农夫与蛇的故事道理10字怎么写

三只小猪简短故事三只小猪简短故事内容