安妮整理和安排
量子位制作| QbitAI,微信官方账号
今天凌晨,英特尔推出了Movidius Myriad X视觉处理单元(VPU),这是一款采用神经计算引擎新结构的低功耗片上系统(SoC)。
神经计算引擎是集成在芯片上的DNN加速器。在它的帮助下,Myriad X功耗低、性能强,可以为无人机、摄像头、安防系统、VR/AR设备、360度摄像头等设备的视觉和AI应用提供高效的解决方案。
这也被认为是英特尔在边缘计算领域迈出的重要一步。
一个多月前,被英特尔收购的Movidius发布了一款运行神经网络的u盘计算棒,售价仅为79美元,其处理核心是Myriad 2 VPU。英特尔表示,Myriad X是Mariad 2的升级版,提升了性能。
△上个月发布的Myriad 2计算棒
Myriad X的性能如何?
官方资料显示,Myriad X长8.7 mm,宽8.5 mm,比成年人的拇指套还小。理论上,它每秒可以执行4万亿次以上的运算。同样功率下,Myriad X运行神经网络的速度比Myriad 2快10倍。
△Myriad X介绍图,左上角是筹码和一美元5美分硬币的大小对比
速度的提升很大程度上归功于在Myriad X上引入了神经计算引擎,这个硬件块使得Myriad X的DNN推理的实际吞吐量达到了每秒一万亿次以上的运算(top)。该芯片还配备了16个矢量处理器来处理图像,比四个Myriad 2配置多,并具有扩展的芯片内存池。
据英特尔称,这些增强的性能使Myriad X能够每秒处理来自八个不同相机的高达7亿像素的视觉输入,并且这种比拇指盖还小的硅片也可以安装在各种设备上。
△麦利亚德X与麦利亚德2的性能比较
神经计算引擎的能力令人印象深刻,但是在如此低的功耗下提供高性能的推理并不容易。Myriad X主要集成了四个重要的设计元素:
灵活的SHAVE处理器:SHAVE处理器原有性能达到数百GFLOPS,加速了神经计算引擎的硬件修复功能。
大规模并行中央存储器:深度神经网络创建大量中间数据,放入芯片帮助用户降低带宽,避免性能障碍。Myriad X芯片的内存设计将移动中间数据的成本降到最低。
灵活的精度:Myriad X VPU本身支持混合精度和灵活的硬件。低功耗运行深度神经网络离不开万千灵活混合精度的支持。
优化库和框架:开发工具包中有与架构密切相关的专用软件库,可以支持矩阵乘法和多维卷积的持续性能。此外,它还包含另一个工具,可以自动将训练好的PC模型移植到Myriad的基础设施中。
Movidius还设想了Myriad X的应用场景。例如,无人机制造商可以将此集成到四轴飞行器中,以帮助他们识别和避开障碍物。相机制造商可以使用Myriad X自动突出显示用户感兴趣的视频部分。英特尔还在可用处理器范围内包括VR耳机、智能设备和机器人。
同时Movidius也表示,Myriad X不会取代Myriad 2。去年1月,Myriad的价格降至不到10美元,但Myriad X采用了更高成本的FinFET处理和额外的硬件功能,将以更高的价格进入不同的市场。
从云端下来的人工智能正一步步走进我们的生活。
-结束-
1.《VPU 英特尔推出升级版VPU:引入神经计算引擎,提速10倍》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《VPU 英特尔推出升级版VPU:引入神经计算引擎,提速10倍》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/shehui/1612758.html