p100 NVIDIA Tesla P100计算卡性能首测：震撼地球！

　　GTX 1080/1070 虽然性能很强悍，但它们在全新的帕斯卡家族中只能算是中档水准，真正的大杀器是顶级大核心 GP100，拥有 3840 个 FP32 单精度、1920 个 FP64 双精度 CUDA 核心，主要面向高性能计算领域。

担任首发的 Tesla P100

，

只开启了 3584 个单精度、1792 个双精度核心，即便如此单、双精度浮点性能也高达 10.6TFlops、5.3TFlops，同时还搭配了 4096-bit 16GB HBM2 高带宽显存，并支持全新的 NVLink 互连总线，取代传统 PCI-E。

那么它到底性能如何呢？圣地亚哥超级计算中心的 Scott Le GrandRoss Walker、亚马逊网络服务的 Scott Le Grand 联合编写了一个通用计算测试工具

AMBER

，可模拟生物分子周围的力场，并与 NVIDIA 合作对 Tesla P100 进行了一番测试，包括单路、双路、四路。

　　由于测试所用硬件还是工程样品，操作系统是 Linux，而且测试工具和测试方法是专门为了考察纯粹计算性能而设计的，所以结果反映的只是纯计算能力，和游戏表现无关。

　　事实上，GP100 核心应该永远不会出现在消费级领域，GTX 1080 Ti、GTX Titan X 2 之类的顶级卡会使用 GP102。

　　参与对比的产品中，

Tesla M40基于麦克斯韦架构大核心 GM200，3072 个流处理器，单精度性能突破 7TFlops，双精度只有 0.21TFlops，搭配 384-bit 12GB GDDR5 显存。

　　Tesla K80使用的是两个开普勒架构大核心 GK210，4992 个流处理器，单双精度浮点性能 8.74、2.91TFlops，搭配两组 384-bit 12GB GDDR5。

　　Tesla K40的核心是 GK110，2880 个流处理器，单双精度浮点性能 4.29、1.43TFlops，搭配 384-bit 12GB GDDR5。

　　GTX 1080、Titan X、980 Ti、980 也都加入了对比，另外还有几颗纯 CPU，包括双路的 E5-2697 v4/2698 v3/2650 v3，分别有 32/32/20 个核心。

　　具体测试原理、流程啥的就不多说了，专业性太强，只简单看看结果：

相比于前辈 M40，P100 的计算性能提升相当猛，绝大部分项目都在 50％左右，少数甚至超过 80％，有的甚至接近 100％！

事实上在大部分时候，单路 P100 都能干掉双路 M40

，领先幅度 10-20％不等。

对比消费级游戏卡，P100 单路已经相当于 GTX Titan X 四路的水准

，也可以看到 GTX 1080 同样十分凶猛，多数情况下都达到或者接近 M40 的水平，但不够稳定，有时候相当于单块 Titan X，有时候超过人家两块。

　　最遗憾的是，

NV-Link 总线的威力还没有发挥出来，双路、四路 P100 的提升幅度普遍还不如 PCI-E。

　　八路 Tesla P100

1.《p100 NVIDIA Tesla P100计算卡性能首测：震撼地球！》援引自互联网，旨在传递更多网络信息知识，仅代表作者本人观点，与本网站无关，侵删请联系页脚下方联系方式。

2.《p100 NVIDIA Tesla P100计算卡性能首测：震撼地球！》仅供读者参考，本网站未对该内容进行证实，对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址，https://www.lu-xu.com/guonei/179997.html