你听说过最近市场上发布的几款新CPU吗?他们的表现很厉害!没错,ARM Cortex-A75和Cortex-A55是第一款基于最新发布的DynamIQ技术的Cortex-A系列处理器。关于Cortex-A75的更多信息,戳这里→。这一次,我们将讨论Cortex-A55,为什么它是未来数字世界的重要处理器。

出生于贵族家庭,经过了考验

更高的性能可以满足人工智能任务的需求,这是当前和未来ARM IP的主要关注点

要了解Cortex-A55的真正潜力,我们先简单回顾一下它的上一代:ARM Cortex-A53。使用这款CPU的设备超过15亿台,依然是当今业界出货量最高的64位Cortex-A系列CPU。Cortex-A53于2012年发布。其独特的设计结合了性能、低功耗和可扩展性,并具有一系列的多用途特性,因此可以用于很多市场,包括高端智能手机、网络基础设施、汽车信息娱乐、高级驾驶员辅助系统、数字电视、入门级移动设备、消费类设备甚至卫星。

然而,自2012年以来,我们周围的世界发生了许多变化。我们现在看到的新兴趋势表明,在所有事情上都相互联系和智能的数字世界具有巨大的发展潜力。人工智能和机器学习将真正融入我们的日常生活,从完全自主的自动驾驶汽车到各种设备上的智能应用,这已经是定局。物联网的普及意味着“物”的爆炸式增长,越来越多的“物”继续产生数据、消费数据、与数据互动。增强现实、虚拟现实、混合现实注定要彻底改变人与人、人与机器的互动,将现实世界与数字世界融为一体。

在过去的两年里,ARM工程师致力于研究Cortex-A53的后续产品,以满足这一新技术的需求。我们的目标是构建一个性能、效率和可扩展性都有很大提高的CPU,而这个CPU也需要很多先进的特性来满足未来从端到云的各种应用需求。幸运的是,我们做到了。

整体性能提升

Cortex-A55实现了全面的性能提升

Cortex-A55采用最新的ARMv8.2架构,基于其前身产品。它在性能方面已经超过了极限,同时仍然保持着与Cortex-A53相同的功耗水平。我们尽一切努力改进Cortex-A53,并赋予其以下特性:

在相同的频率和工艺条件下,内存性能可达Cortex-A53的两倍

在相同的频率和工艺条件下,性能比Cortex-A53高15%

可扩展性比Cortex-A53高十倍以上

这是因为我们专注于Cortex-A53的现有设计理念,以及我们对这些理念的挑战:

一个

分支预测器被完全修改,并且神经网络元件被结合到其算法中以改进预测。此外,还增加了零周期分支预测器,以进一步减少管道中的泡沫。这样,空指令之间的空闲时间越来越短。

2

我们的设计使L2缓存专用于每个CPU,与Cortex-A53相比,L2缓存的访问时间缩短了50%以上。我们还将L2缓存的工作频率设计为与中央处理器相同。通过减少延迟,大大提高各种基准测试工具中的CPU性能。

引入L3缓存,集群中所有Cortex-A55 CPU都可以共享。这使DynamIQ集群能够受益于CPU附近增加的内存容量,从而提高性能并降低系统功耗。L3缓存是动态共享单元的一部分,动态共享单元是动态处理器中的一个新功能单元。

8位整数矩阵乘法对神经网络性能的影响超过85%。Cortex-A55 NEON流水线增加了一条新的架构指令,使其能够在每个周期执行16个8位整数运算。这些新指令还使CPU能够执行8个16位浮点运算,每个周期对两条MAC指令进行舍入,有利于颜色空之间的转换。

与Cortex-A53相比,性能大幅提升

Cortex-A55在功率和热效率方面继续领先

对分支预测器、NEON和FP单元的上述改进以及内存延迟的减少只是Cortex-A55性能大幅提高的一些原因。Cortex-A55不仅实现了显著的性能提升,而且保持了与Cortex-A53相似的功耗。总之,Cortex-A55在节能方面取得了15%的进步。与性能相比,功率在产品设计中更为重要。同样的性能,Cortex-A55的功耗比Cortex-A53低30%!

Cortex-A55提供的持续性能比今天的Cortex-A53解决方案要长得多。这对未来有望主导移动市场的AR、VR、MR中的用户体验非常重要。这些应用程序都是高度线程化的,并且对延迟有严格的要求。后者指的是运动时间延迟。根据行业研究,这种延迟需要保持在20毫秒以内,以免引起恶心和头晕。虽然现在的CPU已经达到了达到20ms延迟所需的性能水平,但是热量限制意味着这些CPU无法长时间保持这个性能水平。借助Cortex-A55,我们可以为未来延长VR设备的连续性能时间提供解决方案。

先进的功能和更高的性能可以满足基础架构市场的需求

行业领先的效率使Cortex-A55在基础设施市场脱颖而出。以太网供电无线接入点和后视镜安装有限加热的汽车解决方案等应用可以使用高热效率的Cortex-A55,在特定的加热范围内提供最高的性能。在5G远程无线电前端,Cortex-A55 CPU也可以在特定的功率范围内最大化网络吞吐量。

从一端扩展到云

合适的尺寸和计算性能可以满足各种要求

除了性能和效率,Cortex-A55的物理芯片尺寸和计算性能也极具扩展性。因此,它包括多个RTL配置选项,这使得可配置的容量是Cortex-A53的十倍。事实上,它有3000多种独特的配置,使其成为历史上最具可扩展性的Cortex-A CPU。

Cortex-A55延续了Cortex-A53的灵活性,有NEON、Crypto、ECC等选项,但也采用了新的实用配置选项。例如,专用L2缓存的可配置容量从64KB到256KB不等,这可以带来约10%的性能提升。专用L2缓存可以提高性能,无疑会成为很多市场的默认选择。它还被设计为一种选项,用于在物联网等对尺寸敏感的市场中进一步缩小芯片尺寸。

DynamIQ共享单元新功能的详细说明

DSU常见于Cortex-A55和Cortex-A75。它包含更多的配置选项,可以根据用户自己的应用进行定制。例如,CPU之间共享的L3缓存可以从0KB扩展到最大4MB。它还支持通过AMBA 5 ACE或CHI的多用途接口选项,可用于更广泛的系统。加速器相干端口和低延迟外围端口也集成到DSU中,这使得紧密耦合的加速器能够连接到Cortex-A55以处理通用计算。这些特性,加上Cortex-A55的机器学习功能,使得更多的计算能够在更接近物联网网关的应用“端”进行。

它包括许多高级功能,可用于各种新兴应用

加快人工智能在各个领域的应用

人工智能会越来越普及,这不是什么新鲜事。推而广之,我们的设备执行机器学习任务将变得非常普遍。片上实现机器学习的方法有很多,但CPU在这方面有独特的优势。CPU可以进行通用计算,所以可以运行到人工智能应用的芯片中。目前机器学习和人工智能不断被取代,功能固定的硬件不仅价格昂贵,而且对于机器学习来说很容易过时。

Cortex-A55 NEON流水线的改进和新的机器学习指令意味着Cortex-A55在矩阵乘法上的机器学习性能比Cortex-A53高得多。最近发布的ARM计算库是针对ARM Cortex-A NEON和Mali GPU IP优化的入门级软件功能集。也可以应用到Cortex-A55 NEON上,进一步提高其机器学习性能!

Cortex-A55可以创造一个更安全的自主系统

Cortex-A55还具有高可靠性、可用性和可维护性特性,使其能够服务于基础设施和汽车等各个领域。对于汽车市场,Cortex-A55的安全性有所提升。它在每一级缓存上提供可选的纠错码和奇偶校验功能,还支持“数据中毒”,这可以延迟检测到的和不可纠正的错误,并适用于更灵活的系统。也是第一款Cortex-A系列CPU采用新的设计工艺,避免系统故障,因此搭配Cortex-R52非常适合ASIL D应用。

深度嵌入式高级电源管理功能

高级电源管理功能提高了能效

Cortex-A55有许多新的电源特性,例如,硬件控制的状态转换可以更快地从开切换到关。Cortex-A55还可以根据当前运行的应用自主关闭L3缓存。对于需要更多内存的重型应用,如VR,L3缓存将完全打开。但是,对于完全驻留在一级和二级缓存中的轻负载应用程序,如音乐播放,三级缓存将被关闭。此外,对于重负载和轻负载之间的应用,有两种电源模式。

现在还可以创建单个CPU或CPU组,其中每个CPU都位于集群内自己独立的电压域中,因此可以更精细地动态增加电压和频率。这有两个主要优点:首先,它允许设计人员进一步调整系统,以实现最佳性能和节能。其次,这也意味着DynamIQ系统可以更容易、更紧密地匹配设备多变的加热极限,从而使其性能最大化。

大的新时代。小加工

大。自2011年问世以来,LITTLE技术一直是异构处理的代名词。所以现在市面上的安卓ARMv8设备,三分之二都是靠大的。优化功率和性能的小技术。DynamIQ大。LITTLE是DynamIQ系统中的新一代异构计算技术。

它允许设计人员创建与Cortex-A75“大型”CPU和Cortex-A55“小型”CPU完全集成的解决方案,这两种CPU在物理上位于单个CPU集群中。所有软件线程迁移和由此产生的大小CPU之间的高速缓存窥探现在都发生在集群中。与Cortex-A73相比,Cortex-A75 CPU可以用于更高频率的应用,同时与Cortex-A55保持连续的DVFS曲线。这是大的重要设计要求。小系统。这些特性结合在一起,与上一代big相比,可以大大提高峰值性能、连续性能和智能功能。小科技。

DynamIQ大。LITTLE可以带来更丰富的用户体验

如今的中端移动和消费市场通常采用基于Cortex-A53的4核和8核解决方案。但是随着人工智能、虚拟现实等高级应用从高端市场向中端市场渗透,厂商需要以更低的成本提供更高的性能和智能功能。DynamIQ大。LITTLE通过引入新的异构CPU配置满足了这一需求,例如1个Cortex-A75 +3个Cortex-A55 和1个Cortex-A75 +7个Cortex-A55 。这些新的配置可以与4核和8核芯片尺寸相近的Cortex-A55设计相媲美,可以实现2倍以上的单线程性能。

基础设施和移动片上系统设计指南已经发布

ARM长期以来一直在验证我们在样本SoC设计方面的知识产权方面投入巨资。随着ARM的知识产权组合日益增多,这些样本系统的复杂度和范围也在不断增加。从SoC架构到详细的产前分析,这项工作涵盖了所有方面。ARM将以“系统指南”的形式提供这样的知识。

除了全新的CPU,ARM还提供了各种新的系统指南,涵盖移动系统和基础设施系统:

CoreLink SGM-775移动系统系统指南是为Cortex-A75、Cortex-A55和Mali-G72设计和优化的

SGM-775包括文件、模型和软件,可由ARM合作伙伴免费使用。

基于Cortex-A55的设备预计何时上市?

Cortex-A55的最终发布令人兴奋。Cortex-A55在性能、节能和可扩展性方面的巨大进步,将使其成为ARM出货量最大的下一代Cortex-A系列CPU。然而,兴奋并不止于此。这个生态系统中的大量ARM合作伙伴已经获得了Cortex-A55的相关许可。让我们期待他们将在未来几个月发布的新一轮智能计算解决方案。虽然我们无法预测基于Cortex-A55的设备将如何呈现,但可以肯定的是,从2018年开始,未来将是极其令人兴奋的!

声明:本文转载于网络,版权归原作者所有。如果涉及到作品的版权问题,请联系我们,我们会根据您提供的版权证明确认版权并支付报酬或删除内容。

1.《a55 Cortex-A55,为何它是对未来数字世界举足轻重的处理器?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《a55 Cortex-A55,为何它是对未来数字世界举足轻重的处理器?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/1697635.html