9月18日,在第四届华为CONNECT 2019大会上,华为发布了全球最快的AI训练集群Atlas 900,将AI训练效率提升了几十万倍。假设训练一次需要5个月,而使用Atlas 900只需要几十秒。(根据实际测量,基于ImageNet数据集训练ResNet-50模型只需要59.8秒,竞品最快时间70秒以上。)
Atlas 900集群采用华为圣腾910,目前最强大的AI处理器,互连数千,每个都有32个达芬奇独立架构的AI内核。整个集群的FP16半精密浮点计算能力达到256-1024次浮点,也就是每秒256-102.4亿次计算!这相当于50万台电脑的计算能力。
目前,阿特拉斯900集成了三种高速互连模式,包括华为自主开发的单端口速率为240Gbps的HCCS片间互连、最新的PCIe 4.0和100G RoCE以太网。同时进行系统级优化,HCCL通信库+网络拓扑+训练算法线性度达到80%以上。
散热方面,Atlas 900采用行业顶级散热系统,尤其是行业最强的柜级封闭保温技术。液冷占95%以上,可以大大减少外部散热。同时高效节能。单液冰箱支持50 kW的超高散热功耗。
华为Atlas 90可以广泛应用于科研和业务创新。比如在天文学领域,正在帮助SKA探索更广阔的宇宙空,也可以在自主驾驶、天气预报、石油勘探等具体领域取得巨大成就。
对此你怎么看?
以上是相关内容,请关注更多信息~ ~
1.《华为AI训练集群 有什么作用如何使用》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《华为AI训练集群 有什么作用如何使用》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/fangchan/946781.html