690核显卡有多强

上次我们谈论10年前的8800GTX时，这是一部彻底改变了未来显卡各个方面的惊人作品。

那么我们今天就从这张开天辟地的显卡开始，来聊聊真·核弹的进化史。

▌8800GTX/8800Ultra

“特斯拉”——不会被遗忘的传说

你也许知道，现在的GPU都是由一个个“流处理器”来负责具体的运算的，可是在那个时代，GPU当中并没有所谓的“流处理器”，而是由一种叫做“渲染管线”的东西负责图形方面的运算。

之前说过，Windows Vista带来了很多革命性的东西，而DX10也正是其中之一，在DX10显卡出来以前，并没有“流处理器”这个说法。GPU内部由“管线”构成，分为像素管线和顶点管线，它们的数目是固定的。简单来说，顶点管线主要负责3D建模，像素管线负责3D渲染。然而这种略显僵化的布局就使得其性能很难完全发挥，因为顶点和像素的工作量在每个具体任务当中并不相同，这就使得其效率并不能达到很高的水平。

而DX10当中引入了一种叫做“统一渲染架构“的东西，具体到显卡上面，就是所谓的”流处理器“。而8800GTX正是应用这一全新理念的始作俑者。

8800GTX所采用的GPU核心代号叫做G80，集成了6.8亿晶体管的它，由于采用了90nm的工艺制造，使得其核心面积接近500平方毫米，在当时的技术下可以说是史无前例的。为了保证其良品率，G80将2D芯片独立出来做成了一枚单独的“NVIO-1”芯片，这也使得其2D画质达到了接近专业2D显卡的水平。

而另一方面，单卡8800GTX的3D性能甚至远超上代旗舰7900GTX SLI，而即使是对手玩了一年的旗舰显卡2900XT也毫无招架之力，更不用说后期推出的官方超频版——8800Ultra。

8800Ultra相较于8800GTX采用了更新的A3步进（8800GTX为A2步进），可以达到更高的频率。这两张显卡都拥有128个流处理器，搭配的显存规格则是后来成为NVIDIA大核心旗舰标配的384bit位宽，以及远超当年主流256MB容量的768MB显存，当然价格也是真·核弹级别，当年19999的双卡套装还历历在目……

这张卡最大的意义在于，它为之后的旗舰卡定下来了真正的“规矩”：10.5英寸长度的PCB、384bit位宽显存、500平方毫米左右的核心面积、涡轮一体式散热器、多路SLI……这一切都成为了自G80推出之后所有NVIDIA“真”旗舰显卡的标准，当然有一些“伪”旗舰显卡例外，这个我们待会再聊。

▌9800GTX(+)/9800GX2

NV再试小核心战略

不同于8800GTX的“巨无霸”规格，9800GTX称得上是一款“缩水”旗舰——事实上它的定价也并不是旗舰级别，而只是次旗舰级别。

9800GTX其实是改名战略下的产物，它搭载的G92核心原本搭载于上代次旗舰8800GTS的后期版本当中，而官方超频并加上多路SLI技术之后，9800GTX就诞生了。

然而这就意味着9800GTX的性能并没有任何惊喜，由于显存仅有256bit 512MB的规格，使得其在高负载状态下性能甚至不如上代8800Ultra，只能在低负载下凭借着高频勉强与8800Ultra持平，不过由于新制程，其功耗的确有了显著的下降，而且2D模块又回到了芯片里，最终的芯片面积落在了300-400平方毫米，这样一来，G92为后来的“伪”旗舰也就定下了标准。

不过作为旗舰，这样的性能显然说不过去。因此9800GX2诞生了。与7950GX2一样，这是一张双核心显卡，而且是由两颗完整的G92核心组成的双核心显卡。但与7950GX2相似的是，这张显卡也同样拥有两张PCB，因此其结构非常复杂，之前为了换硅脂，拆解这张显卡飘哥居然用了一个小时的时间……

不过性能方面，9800GX2还是相当给力的，由于桥接芯片的作用，其SLI效率还是不错的，在支持SLI的游戏当中，9800GX2的性能相较于9800GTX最高甚至可以提升70%左右，然而由于SLI技术并不能叠加显存，因此其512M x 2的显存容量也在一定程度上限制了其表现，不过由于G92核心优秀的能效比，9800GX2的在这样的性能上也提供了合理范围内的功耗和温度，整体还是令人满意的。

▌GTX280/GTX285/GTX295

“巨无霸”再度登场

9800GX2的王位还没捂热乎，NVIDIA的新核弹——GTX280就把它怼了下去。

作为一款“巨无霸”GPU，G80显然是相当成功的，因此NVIDIA在设定GT200架构的开发目标时其实定得非常高——他们要造一颗性能达到8800GTX两倍的产品。

最终NVIDIA给出的GT200核心拥有14亿晶体管，核心面积高达576平方毫米，这个面积直到之后的GM200才终于超过了它。而正是因为这样恐怖的“巨无霸”核心，G80上外置2D芯片的招数再一次故伎重演。

借助巨大的核心规格，新产品的性能的确相当优异，但功耗也十分巨大，这也就使得其PCB的设计异常复杂。另一方面为了达到两倍8800GTX的性能，必须要有巨大的显存带宽，由于当时GDDR5还没有推出，而GDDR4表现又只能说差强人意，因此GTX280搭载了NVIDIA历史上史无前例的512bit 1GB显存，两方面的原因使得其第一版公版PCB成为了NVIDIA迄今为止用料最猛的产品，这个代号也被玩家们永远的记在了心里——P651。

14层PCB版、极尽奢华的数字PWM供电方案，密密麻麻的MLCC电容以及首次在NVIDIA公版卡上出现的全覆盖金属背板，极度豪华的用料使得其成为了NVIDIA历史上做工用料最好的公版显卡。

后来NVIDIA全面转向了55nm工艺，包括G94、G92、GT200等GPU都转向了55nm工艺制造，这就使得GT200核心的功耗大幅度下降，因此其官方超频版GTX285以及双芯版本GTX295也就随之登场。

GTX295这款产品有这前后期两种设计，前期采用和9800GX2相似的双PCB双GPU的设计，我喜欢叫这种设计“夹心饼干“。而另一种设计则是跟后来的GTX590以及对手AMD显卡相同的单PCB双核心设计，这种设计有效降低了成本，只是对PCB的设计提出了更高的要求，不过这款产品为之后GTX590的诞生奠定了坚实的基础。

▌GTX480/GTX580/GTX590

“费米“——惊天大核弹

随着AMD的HD5000系列推向市场，DirectX 11的大门终于被推开，而NVIDIA再次选择了“巨无霸“核心，这直接导致了其产品的难产。这个时段可以说是A卡最扬眉吐气的时代，不过我们留在接下来的A卡篇章中再聊——视线转向NVIDIA这边。

由于台积电的40nm工艺和NVIDIA磨合并不好，Fermi的发布时间一拖再拖，每次流片都令人揪心，终于在对手的DX11显卡推出半年之后，代表着绿色阵营的DX11显卡“Fermi“正式推出。首款产品自然是大核心旗舰，然而这次人们惊奇地发现，首发旗舰GTX480居然不是满血核心！

原来，由于GTX480所搭载的GF100核心规格太大，而台积电的40nm工艺并不能保证足够的良率，因此GTX480屏蔽了32个流处理器，仅有480个流处理器，而且也因为同样的原因，其功耗堪称历代旗舰之首——有不少玩家尝试过用GTX480煎鸡蛋，而且最骚的是他们中的很多人都成功了。

不管怎么说，新旗舰是憋出来了。不说别的，就光看看GTX480公版显卡的散热器外形你就应该明白它有多热。

四根外露的热管，暴露在空气中的金属散热片……这张显卡的TDP是250W，但实际功耗却往往能超过300W，超频之后更是不用说。而性能方面则比对手综合下来稍强10-20%，不过在曲面细分性能方面要比HD5800系列强出数倍，不过除了在DX11应用早期的某些滥用曲面细分的游戏当中，这个优势并不能被很好地体现出来。

而费米架构之所以这么高耗、高热，其中的另一个原因是其对计算性能的深度优化。大量全新功能的加入以及巨大的核心内缓存、强大的双精度运算能力，都在一定程度上影响了其功耗。

这个问题直到GTX580的发布才得到了比较好的解决。GTX580采用了经过重新流片的GF110核心，相较于GF100，GF110删减了一些不需要的冗余单元，优化了制造工艺，使得其功耗更低、频率更高，可以说是挽回了一些GTX480丢掉的面子，不过这代最重要的产品则是GTX560Ti，可以说这款产品为之后NVIDIA的战略调整做出了巨大的贡献，关于这一点，我们之后再详细聊。

回到GTX580这款产品本身，由于制程的优化，GTX580的功耗和发热都得到了一定程度的控制，而最重要的一点是512个流处理器终于可以全部打开了。不过公版GTX580仍然仅仅搭配了1.5G的显存容量，但与初期不开放非公版的GTX480不同，GTX580从一开始就开放了非公版授权，因此非常多的厂商都推出了自家的非公版GTX580，包括EVGA的Classified、微星的Lightning这类恐怖的3GB显存超频版GTX580也降生于世，而这些高规格的GTX580甚至可以超到风冷1GHz的恐怖频率……

当然这时候只是显卡的功耗就会超过400W甚至超过500W，可以说是最恐怖的一代显卡，叫它核弹，绝对是实至名归。不过这时的GTX580性能确实是很不错的，在游戏中甚至可以打败对手的双芯卡皇HD5970，当然功耗也高多了就是了……

不过在将电压降低到0.9v左右之后，GF110的功耗其实并不算高，因此双芯的GTX590也就应运而生，而且由于降压、降频，其功耗和噪音甚至远低于对手的HD6990，不过加压之后会冒烟就是了……

▌GTX680/GTX690/GTX780Ti/Titan/Titan Z

“开普勒”——老黄转型之作

经历过Fermi的滑铁卢之后，NVIDIA突然发现高频版的GTX560Ti其实可以轻松打过默频GTX480，然而功耗却比后者低了不少，另一方面对手的HD7970采用了全新架构，驱动尚不完善，并且默认频率也定的有些低，于是老黄决定，用传统意义上的属于甜品级显卡的GK104核心来做这一代的旗舰显卡——GTX680诞生了。

公版GTX680绝对是最不像旗舰显卡的旗舰显卡，但不到200W的功耗却带来了远超GTX580并力压HD7970的性能，这使得当年的媒体们惊呼其所采用的GK104核心应用了“黑科技”。而一众厂商也相应推出了其非公版产品，加上GPU Boost技术也随着GTX680显卡问世，厂商们和玩家们也开始逐步适应新的超频思路。

因为GK104的低功耗高性能，由两颗GK104核心组成的GTX690显卡也成为了NVIDIA历史上最接近旗舰单芯卡SLI的双芯旗舰，也带来了传说中的泰坦皮的首秀，并得到了“690战术核显卡”的称号。

回到GTX680，由于GTX680并不是一款传统意义上的旗舰，因此非公版授权一开始就是放开的，因此各家的产品也是百花齐放，不过压制以前大火炉的散热器放在GTX680小小的GK104核心上多少有点大材小用，像微星Lightning、EVGA Classified这种卡总觉得散热高过了核心需求，于是真·开普勒旗舰到底还是来了。

GTX Titan基于完整规格的Kepler大核心——GK110，GK110完整的2880个流处理器的规格相较于GK104几乎翻了个翻，不过初期版本的“白泰坦”由于大核心传统的良品率问题仅开启了其中的2688个，然而即便如此，其性能仍然足以傲视群雄，甚至十分接近双芯旗舰GTX690，而后期的GTX780则是白泰坦再割一刀的产物，直到Kepler系列架构的末期，GTX780Ti/黑泰坦才带来了完整的GK110核心，从此NVIDIA的“小核心战略2.0”终于成型——

每代架构问世初期先推出xx4级别的“甜品级”核心，并作为旗舰销售，在这一过程当中继续研发本代“巨无霸”核心，并在“巨无霸“核心量产初期推出Titan产品线来抵消巨大的成本问题。在大核心产品的良品率达到一定高度之后，再推出大核心“真旗舰”，并再度销售一年，此时由于良品率上升成本下降，就可以进入稳定的出货期，并于之前推出的一套完整产品线一起站稳整个市场，在这个过程中继续进行下一代显卡的开发、流片，并在之后重复这一过程，这样一代架构刚好可以应用两年，并始终保持着性能领先和利润最大化的目标。

而这时，NVIDIA还推出了一款看似“计划外”的产品——Titan Z。关于它我并没有太多可以描述，你只要知道它是由两个GK110组成的又一代GTX590就够了，并且它还是唯一一张公版三槽显卡。

▌GTX980/GTX980Ti/Titan X

“麦克斯韦”——史上最高效的GPU架构

接下来的2014年，NVIDIA果然又一次发布了“甜品级旗舰显卡”——搭载着GM204核心的GTX980发布了。但与之前不同的是，GTX980并不是Maxwell架构的首发产品，这个首发产品的荣誉则是属于更低端的GTX750Ti。

Maxwell重新排列了每一个SMX当中的流处理器阵列，使得其效率相较于Kepler架构有着显著的提高，在制造工艺维持28nm不变的情况下，不到400平方毫米的GM204核心却有着超过巨无霸GK110核心的图形性能，不得不令人惊叹于其极高的能耗比。

而Maxwell的真·旗舰——GM200核心也在一年之后的2015年如期而至，Titan X和GTX980Ti兄弟搭载的GM200核心刚好是GM204核心的150%规格，当然核心面积也几乎大了50%，这也就意味着在同频下GTX980Ti的性能甚至会比GTX980高出将近50%，加上GTX970的超高性价比，一时间GTX980的地位显得非常尴尬。而Titan X则继续坚持着高高在上的定价策略，一时间GTX980Ti风头无两。为了避免这样的尴尬，GTX980Ti的公版频率非常保守，然而玩家们发现这款显卡的超频能力远比想象的好得多得多，一时间各类非公版层出不穷，液氮超频下的GTX980Ti甚至霸占着许多排行榜直到GTX1080Ti的诞生。运行在1.5GHz下的GTX980Ti性能甚至堪比后来的公版GTX1080……当然这都是后话了。

总的来说，这一代显卡延续了Kepler家族定下的“规矩”，并且用这种类似“Tick-Tock”的步调让对手非常为难，值得一提的是，接下来的Pascal家族的整体架构其实与Maxwell是基本相同的，这更加证明了Maxwell架构的高效与优秀。不过值得注意的是，由于阉割了双精度计算单元，因此超级计算机领域的GPU仍然采用Kepler架构，重新流片后的GK210即是为此而生，直到Pascal架构的GP100的诞生……

▌GTX1080/GTX1080Ti/Titan Xp

“帕斯卡”——超高频性能神话

终于到了现役核弹了……2016年，NVIDIA发布了全新的Pascal架构小核心旗舰——GTX1080。

仍然延续了之前的套路，其搭载的仍然是一颗“甜点级”小核心，搭配全新的GDDR5X核心。公版GTX1080的性能相较于公版频率下的GTX980Ti提升了20%以上，基本上和1.5GHz的GTX980Ti处于同一水平。

而2017年，不出任何人的意料，搭载着大核心GP102的GTX1080Ti如期而至，而在此之前，Titan X（Pascal）已经与我们见面了。这次大核心的代号并不是GP100或者GP110，而是GP102，这是因为GP102是一款类似GM200的芯片，而GP100则是GK210的继任者，两者的区别就在于对双精度浮点计算的支持度，对于非科学计算需求，双精度单元反而会拖累核心的频率，因此NVIDIA选择了两条腿走路，将科学运算产品单独成全新的GPU。

Pascal架构的频率非常高，但是超频能力却并不高。这是因为NVIDIA在这一代显卡上进一步限制了显卡的超频，我们曾经试过20片GTX1060 G1显卡，居然这20张GTX1060的超频幅度都是完全相同的，其中意味着什么不言自明，后来的GTX1070Ti更是证明了这一点。但无可否认的是，在Pascal系列产品和对手的竞争当中，Pascal的确有着明显的能耗比优势，这也许就是这样严格的超频限制的原因吧。

后记

就在今天，全新的采用Volta架构的TitanV显卡正式发布了，2999美元的售价怎么看都不像是一款游戏显卡该有的价格，而Volta架构也是自GTX750Ti发布之后NVIDIA最大的一次架构调整，明天我也会对Titan V做一个简单的分析。

NVIDIA旗舰显卡一路梳理下来，其实我是有非常多的感慨的，这些显卡可以说是一路陪着我长大，而其中蕴含的商业方面的策略、走过的弯路也让人不得不感叹IT业之风云变幻。

下一期开始，飘哥将开始为你梳理NVIDIA的老对手——AMD（ATI）的旗舰显卡之路，下周五我们再贱~

▼

戳图片传送至往期精彩

喜欢我们的推送别忘了点一个顶

向亲朋好友推荐一下我们的文章

或者赞赏一下

我们下期再见啦！

1.《690核显卡有多强》援引自互联网，旨在传递更多网络信息知识，仅代表作者本人观点，与本网站无关，侵删请联系页脚下方联系方式。

2.《690核显卡有多强》仅供读者参考，本网站未对该内容进行证实，对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址，https://www.lu-xu.com/yule/2068959.html

690核显卡有多强

60天的小鸡怎么受死

momo怎么死的