大家好,显卡30系列深度解析(上篇)相信很多的网友都不是很明白,包括也是一样,不过没有关系,接下来就来为大家分享关于显卡30系列深度解析(上篇)和的一些知识点,大家可以关注收藏,免得下次来找不到哦,下面我们开始吧!
学号:20021210601 姓名:魏素恒
【嵌入式牛介绍】NVIDIA新一代30系列显卡简析。
【嵌入式牛鼻子】RTX3070 RTX3080 RTX3090
【嵌入牛文】
在当前的显卡市场上,占据80%份额的NVIDIA让玩家们又爱又恨。他们带来了近十年来最好的显卡,也让高端游戏卡的价格不断上涨。现在RTX 3090 起价为五位数。
RTX 30系列显卡发布后,玩家的不满似乎得到了缓解。与目前的图灵显卡相比,基于Ampere的RTX
3090/3080/3070显卡突然变得非常受欢迎,因为它们不仅性能翻倍,而且国内价格居然下降了。
·GeForce RTX 3090:取代RTX Titan,与Titan相比
RTX 速度提升50%,性能是RTX 2080 Ti 显卡的两倍。配备24GB GDDR6X显存,售价11999元,9月24日上市。
·GeForce RTX 3080:取代RTX 2080 Ti,与RTX相比
2080的性能提升2倍,配备10GB GDDR6X显存。海外699美元价格没有变化,但国内价格从上一代的6499元降至5499元。将于9月17日上线。
GeForce RTX 3070:价格不到RTX 2080 Ti 的一半,但平均性能更高,比RTX 2070 快整整60%,配备8GB
GDDR6显存售价3899元,将于10月份上市。
RTX30系列显卡价格及上市时间
RTX30系列显卡性能变化
RTX
30系列显卡规格
从这张规格表中可以看出,与RTX 2080 Ti显卡相比,RTX 3090标志性的FP32性能从13.4T提升到35.7T,增加了一倍多,并且在光追和AI加速方面的提升也很明显。
与Turing显卡相比,Ampere GPU的变化令人惊讶。在过去十年的显卡升级中,性能翻倍的情况并不多见。英伟达是如何做到的?
今天我们就来详细讲解Ampere GPU的架构,探究它带来了哪些被NVIDIA创始人黄仁勋称为史上最大的性能提升的技术升级。
先从工艺说起:12nm秒杀7nm后,8nm如何进一步发展?
对于半导体芯片来说,关键的一环就是工艺技术。先进的架构也必须通过技术来实现。这是影响芯片能效、性能甚至成本的主要因素。
对于NVIDIA来说,他们的Volta和Turing架构都是基于台积电的12nm FFN工艺,这是台积电16nm工艺的改进版本。如果算上16nm Pascal架构的话,其实过去三代GPU并没有产生什么明显的影响。该流程已升级。
在Ampere架构上,NVIDIA终于升级了工艺,不过这次有两个惊喜。首先,——没有选择台积电,其次,它没有选择7nm,而是三星定制的8nm工艺。虽然看起来和7nm只有1nm的差别,但实际上是两代工艺。
考虑到NVIDIA此前在技术上的立场,预计将采用三星的8nm工艺,而不是7nm工艺。最关键的问题是NVIDIA 能做得如何。
三星的8nm工艺是在10nm工艺基础上的改进。至少有两个版本:LPP 和LPU。前者适用于移动SoC,后者适用于高性能芯片。 NVIDIA的定制很可能是基于后者。
与台积电7nm工艺晶体管密度约1亿个/mm2相比,8nm工艺约6000万个晶体管/mm2,但这是单个SRAM芯片的比较。事实上,GPU芯片更复杂,差距会小很多。
根据NVIDIA公布的信息,台积电7nm工艺制造的Ampere A100核心拥有540亿个晶体管,核心面积为826mm2,而三星8nm工艺制造的GA102核心拥有280亿个晶体管。核心区尚未正式公布。据悉,其尺寸为628mm2,同样是大芯。
以此计算,7nm A100核心的晶体管密度为6560万个晶体管/mm2,而三星的8nm GA102核心也有4460万个晶体管/mm2。差距仍然存在,但似乎可以接受。
三星8nm工艺的晶圆代工价格目前仍是一个秘密,但从技术和商业策略来看,三星会比台积电便宜很多。预计代工价差将达到30%甚至更高,所以这也是RTX 30系列显卡无法涨价的原因。甚至是降价的关键。
那么三星8nm工艺带来了多大的性能和能效提升呢?首先可以看到RTX 30系列显卡的频率有所提升,从RTX 20系列的1.5GHz+提升到了1.7GHz+。升级后的工艺提高了性能。
不过RTX 20系列的加速频率实际上可以达到1.9GHz甚至接近2GHz,而RTX 30系列预计也会达到这个水平。
然而,能源效率得到了提高。 NVIDIA官方宣称,在60fps性能下,图灵显卡的功耗约为240W,安培显卡的功耗则在120W以上。算下来,是能源效率的1.9倍,提升了90%,而且温度也更低。 3度,噪音降低2分贝。
总体来说,在工艺方面,大家对于Ampere GPU是既惊讶又失望。令人失望的是,它没有预期的7nm工艺(无论台积电还是三星),工艺仍然升级到8nm。
不过,NVIDIA的工艺虽然不算激进,但性能和能效却有了很大的提升。安培显卡各方面都明显优于现在的图灵卡,而且价格不升反降。这也不是追求激进的技术。优点是12nm无论如何都能赢,但现在上8nm更有把握。
Ampere GPU架构详解:FP32单元加倍CUDA核心,有什么变化?
Ampere发布时,NVIDIA首席执行官黄仁勋表示,这是GPU历史上最大的性能飞跃。 2018年图灵GPU推出时,黄仁勋也同样表示,—— GPU是史上最大的改变。这两个评价其实都是正确的。
图灵GPU架构有很多第一。首次支持RTX Core(光追加速单元),首次支持Tensor Core,还改进了CUDA内核,但前两者才是重点。
在Ampere GPU、RT Core、Tensor 上
当然,Core还在继续加强,但主要亮点还是CUDA架构的改进。性能倍增的根源就在这里。我们先来看看这方面的变化。
GA102核心架构图
GA102核心共有7组GPC单元,每组有12组SM单元,总共84组。 RTX 30系列显卡中启用的SM单元总数取决于不同的规格。 RTX 3090有82组,RTX 3080有68组,RTX 30系列显卡有82组。
3070是46组。
在之前的GA100核心中,每组SM由64个INT32单元、64个FP32单元和32个FP64单元组成。不过在GA102核心中,FP64单元大幅减少,增加了RT Core,Tensor Core也略有减少。
GA102核心SM单元
沿袭了之前的Turing GPU路线,Ampere GPU的SM单元并没有增加太多,但实际上FP32性能却提升了一倍多。算上频率,RTX 3080的理论性能几乎是RTX 2080的三倍。这是怎么做到的呢?
答案是把CUDA核心的FP32加倍,但是加倍的方法有点特殊。每个SM单元有4个分区,除了第三代Tensor之外的每个分区
除了Core核心之外,还有一组16个FP32单元、16个FP32单元、16个IN32单元。后者可以同时执行FP32 或INT32 操作。
16个FP32单元每个周期可以执行16个FP32操作,混合单元可以执行32个FP32或16个FP32+16个INT32。
这样,每个SM单元可以同时执行4x(16FP32+16FP32)=128 FP32操作,或者4x(16FP32+16INT32)=64 FP32 + 64 INT32操作。
如果只算FP32浮点数的话,那么浮点数就翻倍了,因为Turing和GA100每个周期只有64个FP32浮点数,现在可以做128个FP32运算。
提高FP32 性能对于游戏和计算都有很大好处,但也需要配套的改进。 GA102的L1容量提升了33%,L1带宽翻倍,从116GB/s提升到219GB/s,共享内存性能也从116GB/s提升到219GB/s。 64B 翻倍为128B。
Ampere GPU架构详解:RTX光线追踪从可用到易用升级
上一代图灵GPU架构的最大亮点就是RTX实时光线追踪技术的引入,开启了3D游戏的光线追踪时代,意义重大。
不过,做先锋的代价也不小,图灵GPU的光线追踪效果在实际游戏中并不明显,对性能影响很大。第一代RTX 光线追踪只能说是解决了问题,而目前的Ampere GPU 更有用的是RTX 光线追踪。
在Turing GPU 上,NVIDIA 使用的第一代RT
Core可以提供10Giga Rays/s的性能,并且在Ampere GPU上,RT Core已经升级到第二代,号称性能提升一倍。仅此一点就可以极大地提高光追踪性能。
图灵GPU光追架构
Ampere GPU 光追踪
但这还不够。在Ampere GPU上,参与光追应用加速的不仅仅是SM单元和RT单元。第三代Tensor Core单元也参与更多。 Ampere架构中的SM、RT、Tensor单元的性能均得到了大幅提升。以RTX 3080为例,SM单元性能从11T提升到30T,RT性能从上一代34T提升到58T,Tensor性能从89暴涨到238T。
这样做的结果之一是光追踪性能得到了极大的提高。不支持硬件加速的Pascal GPU 渲染一帧需要51 毫秒。图灵可以将其增加到19ms。通过DLSS,可以缩短到13ms,这已经比60fps的要求低很多了。 16.6 毫秒帧时间。
在Ampere GPU 上,时间甚至可以更快。仅硬件加速即可从13ms缩短至7.5ms。加上第二代技术后,仅为6.7ms。
总之,就RT光追性能而言,别说没有硬件加速的Pascal显卡,相比RTX 2080到RTX 3080的变化,软件渲染的性能提升了40%,有硬件加速的情况下提升了70%,硬件加速+DLSS也得到了提升。 70%,加上其他技术的辅助,光追性能最高可提升90%。
显卡30系列深度解析(上篇)和的问题分享结束啦,以上的文章解决了您的问题吗?欢迎您下次再来哦!
【显卡30系列深度解析(上篇)】相关文章:
2.米颠拜石
3.王羲之临池学书
8.郑板桥轶事十则
用户评论
最近想升级显卡,感觉30系列蛮火的
有11位网友表示赞同!
30系一直是我的心头好,性能强悍啊!
有9位网友表示赞同!
等不及想知道哪个型号更适合我呢
有17位网友表示赞同!
看标题应该是针对玩游戏的吧,30系对游戏体验影响很大啊。
有8位网友表示赞同!
希望这篇文章能简单直白的讲解一下每个型号的特点
有18位网友表示赞同!
之前一直没弄清楚30系的命名规则,希望这篇分析能搞懂。
有9位网友表示赞同!
学习一下30系显卡的优缺点,以便下决策呢!
有13位网友表示赞同!
文章能否对比一下不同型号的性能提升?
有15位网友表示赞同!
对新手入门的朋友来说,一篇浅析正好合适!
有17位网友表示赞同!
期待看到30系的最新动态和分析!
有5位网友表示赞同!
看标题感觉这个“前”应该是分两批写吧?后半部分也值得期待!
有16位网友表示赞同!
希望这篇文章能涵盖30系的主要型号,方便我比较选择!
有9位网友表示赞同!
我的电脑配置有点老了,wondering if 30 series would be a big upgrade ?
有8位网友表示赞同!
想了解一下30系显卡的性价比怎么样?
有12位网友表示赞同!
文章能不能简单介绍一下30系的功耗和散热情况呢?
有17位网友表示赞同!
我的预算有限,不知道可以选择哪些型号。希望这篇文章能给我一些建议!
有15位网友表示赞同!
最近听说30系显卡的驱动比较稳定了?是真的吗?
有12位网友表示赞同!
除了游戏性能,30系显卡还能用于什么场景呢?
有14位网友表示赞同!
对于专业用途来说,30系显卡怎么样?
有6位网友表示赞同!
期待看到这篇对30系显卡的详细浅析!
有14位网友表示赞同!