上次我们谈论10年前的8800GTX时,这是一部彻底改变了未来显卡各个方面的惊人作品。

那么我们今天就从这张开天辟地的显卡开始,来聊聊真·核弹的进化史。

▌8800GTX/8800Ultra

“特斯拉”——不会被遗忘的传说

你也许知道,现在的GPU都是由一个个“流处理器”来负责具体的运算的,可是在那个时代,GPU当中并没有所谓的“流处理器”,而是由一种叫做“渲染管线”的东西负责图形方面的运算。

之前说过,Windows Vista带来了很多革命性的东西,而DX10也正是其中之一,在DX10显卡出来以前,并没有“流处理器”这个说法。GPU内部由“管线”构成,分为像素管线和顶点管线,它们的数目是固定的。简单来说,顶点管线主要负责3D建模,像素管线负责3D渲染。然而这种略显僵化的布局就使得其性能很难完全发挥,因为顶点和像素的工作量在每个具体任务当中并不相同,这就使得其效率并不能达到很高的水平。

而DX10当中引入了一种叫做“统一渲染架构“的东西,具体到显卡上面,就是所谓的”流处理器“。而8800GTX正是应用这一全新理念的始作俑者。

8800GTX所采用的GPU核心代号叫做G80,集成了6.8亿晶体管的它,由于采用了90nm的工艺制造,使得其核心面积接近500平方毫米,在当时的技术下可以说是史无前例的。为了保证其良品率,G80将2D芯片独立出来做成了一枚单独的“NVIO-1”芯片,这也使得其2D画质达到了接近专业2D显卡的水平。

而另一方面,单卡8800GTX的3D性能甚至远超上代旗舰7900GTX SLI,而即使是对手玩了一年的旗舰显卡2900XT也毫无招架之力,更不用说后期推出的官方超频版——8800Ultra。

8800Ultra相较于8800GTX采用了更新的A3步进(8800GTX为A2步进),可以达到更高的频率。这两张显卡都拥有128个流处理器,搭配的显存规格则是后来成为NVIDIA大核心旗舰标配的384bit位宽,以及远超当年主流256MB容量的768MB显存,当然价格也是真·核弹级别,当年19999的双卡套装还历历在目……

这张卡最大的意义在于,它为之后的旗舰卡定下来了真正的“规矩”:10.5英寸长度的PCB、384bit位宽显存、500平方毫米左右的核心面积、涡轮一体式散热器、多路SLI……这一切都成为了自G80推出之后所有NVIDIA“真”旗舰显卡的标准,当然有一些“伪”旗舰显卡例外,这个我们待会再聊。

▌9800GTX(+)/9800GX2

NV再试小核心战略

不同于8800GTX的“巨无霸”规格,9800GTX称得上是一款“缩水”旗舰——事实上它的定价也并不是旗舰级别,而只是次旗舰级别。

9800GTX其实是改名战略下的产物,它搭载的G92核心原本搭载于上代次旗舰8800GTS的后期版本当中,而官方超频并加上多路SLI技术之后,9800GTX就诞生了。

然而这就意味着9800GTX的性能并没有任何惊喜,由于显存仅有256bit 512MB的规格,使得其在高负载状态下性能甚至不如上代8800Ultra,只能在低负载下凭借着高频勉强与8800Ultra持平,不过由于新制程,其功耗的确有了显著的下降,而且2D模块又回到了芯片里,最终的芯片面积落在了300-400平方毫米,这样一来,G92为后来的“伪”旗舰也就定下了标准。

不过作为旗舰,这样的性能显然说不过去。因此9800GX2诞生了。与7950GX2一样,这是一张双核心显卡,而且是由两颗完整的G92核心组成的双核心显卡。但与7950GX2相似的是,这张显卡也同样拥有两张PCB,因此其结构非常复杂,之前为了换硅脂,拆解这张显卡飘哥居然用了一个小时的时间……

不过性能方面,9800GX2还是相当给力的,由于桥接芯片的作用,其SLI效率还是不错的,在支持SLI的游戏当中,9800GX2的性能相较于9800GTX最高甚至可以提升70%左右,然而由于SLI技术并不能叠加显存,因此其512M x 2的显存容量也在一定程度上限制了其表现,不过由于G92核心优秀的能效比,9800GX2的在这样的性能上也提供了合理范围内的功耗和温度,整体还是令人满意的。

▌GTX280/GTX285/GTX295

“巨无霸”再度登场

9800GX2的王位还没捂热乎,NVIDIA的新核弹——GTX280就把它怼了下去。

作为一款“巨无霸”GPU,G80显然是相当成功的,因此NVIDIA在设定GT200架构的开发目标时其实定得非常高——他们要造一颗性能达到8800GTX两倍的产品。

最终NVIDIA给出的GT200核心拥有14亿晶体管,核心面积高达576平方毫米,这个面积直到之后的GM200才终于超过了它。而正是因为这样恐怖的“巨无霸”核心,G80上外置2D芯片的招数再一次故伎重演。

借助巨大的核心规格,新产品的性能的确相当优异,但功耗也十分巨大,这也就使得其PCB的设计异常复杂。另一方面为了达到两倍8800GTX的性能,必须要有巨大的显存带宽,由于当时GDDR5还没有推出,而GDDR4表现又只能说差强人意,因此GTX280搭载了NVIDIA历史上史无前例的512bit 1GB显存,两方面的原因使得其第一版公版PCB成为了NVIDIA迄今为止用料最猛的产品,这个代号也被玩家们永远的记在了心里——P651。

14层PCB版、极尽奢华的数字PWM供电方案,密密麻麻的MLCC电容以及首次在NVIDIA公版卡上出现的全覆盖金属背板,极度豪华的用料使得其成为了NVIDIA历史上做工用料最好的公版显卡。

后来NVIDIA全面转向了55nm工艺,包括G94、G92、GT200等GPU都转向了55nm工艺制造,这就使得GT200核心的功耗大幅度下降,因此其官方超频版GTX285以及双芯版本GTX295也就随之登场。

GTX295这款产品有这前后期两种设计,前期采用和9800GX2相似的双PCB双GPU的设计,我喜欢叫这种设计“夹心饼干“。而另一种设计则是跟后来的GTX590以及对手AMD显卡相同的单PCB双核心设计,这种设计有效降低了成本,只是对PCB的设计提出了更高的要求,不过这款产品为之后GTX590的诞生奠定了坚实的基础。

▌GTX480/GTX580/GTX590

“费米“——惊天大核弹

随着AMD的HD5000系列推向市场,DirectX 11的大门终于被推开,而NVIDIA再次选择了“巨无霸“核心,这直接导致了其产品的难产。这个时段可以说是A卡最扬眉吐气的时代,不过我们留在接下来的A卡篇章中再聊——视线转向NVIDIA这边。

由于台积电的40nm工艺和NVIDIA磨合并不好,Fermi的发布时间一拖再拖,每次流片都令人揪心,终于在对手的DX11显卡推出半年之后,代表着绿色阵营的DX11显卡“Fermi“正式推出。首款产品自然是大核心旗舰,然而这次人们惊奇地发现,首发旗舰GTX480居然不是满血核心!

原来,由于GTX480所搭载的GF100核心规格太大,而台积电的40nm工艺并不能保证足够的良率,因此GTX480屏蔽了32个流处理器,仅有480个流处理器,而且也因为同样的原因,其功耗堪称历代旗舰之首——有不少玩家尝试过用GTX480煎鸡蛋,而且最骚的是他们中的很多人都成功了。

不管怎么说,新旗舰是憋出来了。不说别的,就光看看GTX480公版显卡的散热器外形你就应该明白它有多热。

四根外露的热管,暴露在空气中的金属散热片……这张显卡的TDP是250W,但实际功耗却往往能超过300W,超频之后更是不用说。而性能方面则比对手综合下来稍强10-20%,不过在曲面细分性能方面要比HD5800系列强出数倍,不过除了在DX11应用早期的某些滥用曲面细分的游戏当中,这个优势并不能被很好地体现出来。

而费米架构之所以这么高耗、高热,其中的另一个原因是其对计算性能的深度优化。大量全新功能的加入以及巨大的核心内缓存、强大的双精度运算能力,都在一定程度上影响了其功耗。

这个问题直到GTX580的发布才得到了比较好的解决。GTX580采用了经过重新流片的GF110核心,相较于GF100,GF110删减了一些不需要的冗余单元,优化了制造工艺,使得其功耗更低、频率更高,可以说是挽回了一些GTX480丢掉的面子,不过这代最重要的产品则是GTX560Ti,可以说这款产品为之后NVIDIA的战略调整做出了巨大的贡献,关于这一点,我们之后再详细聊。

回到GTX580这款产品本身,由于制程的优化,GTX580的功耗和发热都得到了一定程度的控制,而最重要的一点是512个流处理器终于可以全部打开了。不过公版GTX580仍然仅仅搭配了1.5G的显存容量,但与初期不开放非公版的GTX480不同,GTX580从一开始就开放了非公版授权,因此非常多的厂商都推出了自家的非公版GTX580,包括EVGA的Classified、微星的Lightning这类恐怖的3GB显存超频版GTX580也降生于世,而这些高规格的GTX580甚至可以超到风冷1GHz的恐怖频率……

当然这时候只是显卡的功耗就会超过400W甚至超过500W,可以说是最恐怖的一代显卡,叫它核弹,绝对是实至名归。不过这时的GTX580性能确实是很不错的,在游戏中甚至可以打败对手的双芯卡皇HD5970,当然功耗也高多了就是了……

不过在将电压降低到0.9v左右之后,GF110的功耗其实并不算高,因此双芯的GTX590也就应运而生,而且由于降压、降频,其功耗和噪音甚至远低于对手的HD6990,不过加压之后会冒烟就是了……

▌GTX680/GTX690/GTX780Ti/Titan/Titan Z

“开普勒”——老黄转型之作

经历过Fermi的滑铁卢之后,NVIDIA突然发现高频版的GTX560Ti其实可以轻松打过默频GTX480,然而功耗却比后者低了不少,另一方面对手的HD7970采用了全新架构,驱动尚不完善,并且默认频率也定的有些低,于是老黄决定,用传统意义上的属于甜品级显卡的GK104核心来做这一代的旗舰显卡——GTX680诞生了。

公版GTX680绝对是最不像旗舰显卡的旗舰显卡,但不到200W的功耗却带来了远超GTX580并力压HD7970的性能,这使得当年的媒体们惊呼其所采用的GK104核心应用了“黑科技”。而一众厂商也相应推出了其非公版产品,加上GPU Boost技术也随着GTX680显卡问世,厂商们和玩家们也开始逐步适应新的超频思路。

因为GK104的低功耗高性能,由两颗GK104核心组成的GTX690显卡也成为了NVIDIA历史上最接近旗舰单芯卡SLI的双芯旗舰,也带来了传说中的泰坦皮的首秀,并得到了“690战术核显卡”的称号。

回到GTX680,由于GTX680并不是一款传统意义上的旗舰,因此非公版授权一开始就是放开的,因此各家的产品也是百花齐放,不过压制以前大火炉的散热器放在GTX680小小的GK104核心上多少有点大材小用,像微星Lightning、EVGA Classified这种卡总觉得散热高过了核心需求,于是真·开普勒旗舰到底还是来了。

GTX Titan基于完整规格的Kepler大核心——GK110,GK110完整的2880个流处理器的规格相较于GK104几乎翻了个翻,不过初期版本的“白泰坦”由于大核心传统的良品率问题仅开启了其中的2688个,然而即便如此,其性能仍然足以傲视群雄,甚至十分接近双芯旗舰GTX690,而后期的GTX780则是白泰坦再割一刀的产物,直到Kepler系列架构的末期,GTX780Ti/黑泰坦才带来了完整的GK110核心,从此NVIDIA的“小核心战略2.0”终于成型——

每代架构问世初期先推出xx4级别的“甜品级”核心,并作为旗舰销售,在这一过程当中继续研发本代“巨无霸”核心,并在“巨无霸“核心量产初期推出Titan产品线来抵消巨大的成本问题。在大核心产品的良品率达到一定高度之后,再推出大核心“真旗舰”,并再度销售一年,此时由于良品率上升成本下降,就可以进入稳定的出货期,并于之前推出的一套完整产品线一起站稳整个市场,在这个过程中继续进行下一代显卡的开发、流片,并在之后重复这一过程,这样一代架构刚好可以应用两年,并始终保持着性能领先和利润最大化的目标。

而这时,NVIDIA还推出了一款看似“计划外”的产品——Titan Z。关于它我并没有太多可以描述,你只要知道它是由两个GK110组成的又一代GTX590就够了,并且它还是唯一一张公版三槽显卡。

▌GTX980/GTX980Ti/Titan X

“麦克斯韦”——史上最高效的GPU架构

接下来的2014年,NVIDIA果然又一次发布了“甜品级旗舰显卡”——搭载着GM204核心的GTX980发布了。但与之前不同的是,GTX980并不是Maxwell架构的首发产品,这个首发产品的荣誉则是属于更低端的GTX750Ti。

Maxwell重新排列了每一个SMX当中的流处理器阵列,使得其效率相较于Kepler架构有着显著的提高,在制造工艺维持28nm不变的情况下,不到400平方毫米的GM204核心却有着超过巨无霸GK110核心的图形性能,不得不令人惊叹于其极高的能耗比。

而Maxwell的真·旗舰——GM200核心也在一年之后的2015年如期而至,Titan X和GTX980Ti兄弟搭载的GM200核心刚好是GM204核心的150%规格,当然核心面积也几乎大了50%,这也就意味着在同频下GTX980Ti的性能甚至会比GTX980高出将近50%,加上GTX970的超高性价比,一时间GTX980的地位显得非常尴尬。而Titan X则继续坚持着高高在上的定价策略,一时间GTX980Ti风头无两。为了避免这样的尴尬,GTX980Ti的公版频率非常保守,然而玩家们发现这款显卡的超频能力远比想象的好得多得多,一时间各类非公版层出不穷,液氮超频下的GTX980Ti甚至霸占着许多排行榜直到GTX1080Ti的诞生。运行在1.5GHz下的GTX980Ti性能甚至堪比后来的公版GTX1080……当然这都是后话了。

总的来说,这一代显卡延续了Kepler家族定下的“规矩”,并且用这种类似“Tick-Tock”的步调让对手非常为难,值得一提的是,接下来的Pascal家族的整体架构其实与Maxwell是基本相同的,这更加证明了Maxwell架构的高效与优秀。不过值得注意的是,由于阉割了双精度计算单元,因此超级计算机领域的GPU仍然采用Kepler架构,重新流片后的GK210即是为此而生,直到Pascal架构的GP100的诞生……

▌GTX1080/GTX1080Ti/Titan Xp

“帕斯卡”——超高频性能神话

终于到了现役核弹了……2016年,NVIDIA发布了全新的Pascal架构小核心旗舰——GTX1080。

仍然延续了之前的套路,其搭载的仍然是一颗“甜点级”小核心,搭配全新的GDDR5X核心。公版GTX1080的性能相较于公版频率下的GTX980Ti提升了20%以上,基本上和1.5GHz的GTX980Ti处于同一水平。

而2017年,不出任何人的意料,搭载着大核心GP102的GTX1080Ti如期而至,而在此之前,Titan X(Pascal)已经与我们见面了。这次大核心的代号并不是GP100或者GP110,而是GP102,这是因为GP102是一款类似GM200的芯片,而GP100则是GK210的继任者,两者的区别就在于对双精度浮点计算的支持度,对于非科学计算需求,双精度单元反而会拖累核心的频率,因此NVIDIA选择了两条腿走路,将科学运算产品单独成全新的GPU。

Pascal架构的频率非常高,但是超频能力却并不高。这是因为NVIDIA在这一代显卡上进一步限制了显卡的超频,我们曾经试过20片GTX1060 G1显卡,居然这20张GTX1060的超频幅度都是完全相同的,其中意味着什么不言自明,后来的GTX1070Ti更是证明了这一点。但无可否认的是,在Pascal系列产品和对手的竞争当中,Pascal的确有着明显的能耗比优势,这也许就是这样严格的超频限制的原因吧。

后记

就在今天,全新的采用Volta架构的TitanV显卡正式发布了,2999美元的售价怎么看都不像是一款游戏显卡该有的价格,而Volta架构也是自GTX750Ti发布之后NVIDIA最大的一次架构调整,明天我也会对Titan V做一个简单的分析。

NVIDIA旗舰显卡一路梳理下来,其实我是有非常多的感慨的,这些显卡可以说是一路陪着我长大,而其中蕴含的商业方面的策略、走过的弯路也让人不得不感叹IT业之风云变幻。

下一期开始,飘哥将开始为你梳理NVIDIA的老对手——AMD(ATI)的旗舰显卡之路,下周五我们再贱~

戳图片传送至往期精彩

喜欢我们的推送别忘了点一个顶

向亲朋好友推荐一下我们的文章

或者赞赏一下

我们下期再见啦!

1.《690核显卡有多强》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《690核显卡有多强》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/yule/2068959.html