作者|刘晓恬模拟秀专栏作家
介绍:应仿真展示平台邀请,7月10日,我将在2020仿真知识周(第五场)与并行技术高级工程师、中国计算机联合会高性能计算委员会委员郭宇先生分享“面向仿真工程师和企业的高性能解决方案”。建议报名。以下文章是我7月9日凌晨5点完成的原创文章,想和大家分享一下。
我第一次接触计算机是在20多年前的小学。当时学校教大家使用286电脑和DOS操作系统。曾经我用DIR命令给比较无知的同学展示用电脑刷屏的乐趣。有时候5.25寸的软盘里塞满了无数新建的多级目录,被老师下令一个个删除。但是,我默默的把软盘扔进了垃圾桶,或者用它当滤镜看日全食。我用format命令浪费了学校旁边一个机房的系统,只是因为新老板在统计我们在电脑上玩游戏的时间,要求变得更高了。
图片来自网络
直到2010年自学有限元方法的时候,我都是把电脑当成玩游戏的玩具或者打字写WPS的通用工具。我从来不会因为“计算”而为电脑性能烦恼。直到2010年的Solid Works模拟模块和2011年的ANSYS结构模块的应用,中等性能笔记本的CPU和内存被用到极限,以至于多次发疯,因为速度太慢或者无法计算,然后才真正意识到原来的电脑还有这个操作。而作者与仿真软件的奋斗史,就是不断升级计算机硬件,不断追求更高、更快、更强的血泪史。
第一,2009年,我自费买了一个笔记本办公室,成了设计部的奇葩
从2009年开始,国有企业自费购买双核5000元(注:文中所有核心均代表物理核心数,HT技术生产的虚拟核心不做测试。你想想,这个词就是“线”。搭载t6600处理器的笔记本成为设计部门的奇葩,用于机械设计。接触有限元后,其内存容量从2G升级到6G,再升级到8G的硬件极限,感觉还是不够。几天后,就成了一个重要的转折点。当时计算了一个模态分析,内存满负荷70小时CPU利用率为5%,硬盘满负荷运行到蓝屏死亡,重新计算80小时得到结果。
从一次痛苦的经历中,石天说应该有光和固态硬盘。2012年,我花了1050元从英特尔公司买了一个330系列120G固态硬盘,直接把计算时间缩短到5小时左右。
这个经历让我充分意识到,高性能计算需要协调最慢组件的性能瓶颈,才能充分发挥整体效率,这是木桶效应的又一个现实案例。因为笔记本硬件的极限内存只有8G,这只是ANSYS推荐的最低配置要求。经常遇到因为内存不足无法自动计算或调用虚拟内存的尴尬,导致模拟速度变慢10倍(当然也是因为容量不足无法完全节省计算量的原因)。
第二,2013年,我组装了一台带固态硬盘的台式机
2013年,在搜索众多硬件评测文章的基础上,组装了一款搭载4核志强1230V2处理器、16G内存、120G固态硬盘的台式机。一年后,内存价格稍微正常后,升级到32G,组成了整个电脑配置。
总的来说,记忆容量是一票否决的核心问题,直接决定了能否计算。尽可能增加内存是最划算的选择。毕竟一个不好的计算结果总是比0输出好,因为无法计算。
这里有一个关于超线程技术的补充问题。模拟软件只能开启一个任务,可以把电脑的整体性能颠倒过来。这与超线程技术严重不符,超线程技术加速了同时运行多个程序的应用场景。几乎所有的电脑都默认开启这项技术,所以关闭它是一个更高效的选择。据笔者测试,关机后整体计算时间可缩短0%-5%。别看这点小差别,这是一劳永逸的操作,相当于电脑硬件性能一旦设置就永久免费升级。为什么不可以?它的关闭设置在不同的计算机上操作类似,但也有一些不同。建议在网上搜索具体方法。
对于模拟分析,显卡就不那么重要了。
因为大部分的模拟模型已经被极度简化了,模型的复杂度和光照效果在大多数情况下可以忽略。当时XEON 1235为了省钱,如果是内置CPU显卡的机型,需要加100元。作者的选择是70元买一个256M内存的2008年Geforce 9600GT显卡,30元买最破的散热器。
除非你要处理几千万的网格,大多数情况下,一个差的显卡就够了。作者的二手显卡,在不超过500万格的结构计算下,在任何情况下基本没有卡涩。
第三,2016年,我第一次买了beta CPU
到2016年,V2版的CPU性能将是旧的。2009年,笔记本变老变强,创造了ANSYS软件16.0版的新纪录,从点安装到正常程序打开,耗时500秒。再次感受到SSD的速度优势。
志强2696工作站的水泵和散热器
再一次在网上搜了各种测试文章,终于定位到了志强E5-2696V2 CPU的双向24核48线程工作站。
因为V2配的是带ECC的DD3 REG内存,价格是使用DDR4普通内存的V3 CPU的30%左右,性价比很高。结果在同样的预算下,整体性能损失了10%,却可以买到双倍容量的64G内存,然后升级到76G。
这是我第一次买beta版的CPU,比官方版量产价格低30%,性能一样,味道也很好吃。
beta CPU的来源是90年代英特尔公司奔腾CPU浮点运算错误事故后的新策略,造成了数百万美元的损失。官方模型上市前,分发了一定数量不成熟的beta版CPU,验证了各种应用和场景的使用,从而发现问题,修改设计。其非官方渠道的价格是上市后同型号官方制作版的1.5 ~ 40%。这个价格太惊人了,可能会颠覆很多人对CPU价格体系的认知。强烈推荐。
缺点是潜在的不稳定性和不兼容性。解决办法是在保修期内全面测试,再退一次。
显卡一如既往的还是二手的Quadro K420,最低配置98元,处理几百万的网格没有压力。偶尔1000万网格的流体计算会稍微卡一点。从此不再因为内存不足而无法进行详细的计算。虽然最新款电脑内存160 g,但可以更随意,更局部。
自从工作站换了以后,性能有了显著的提升,有机会去实践一些以前没有做过或者是浪费时间的计算项目。当然,模拟软件的版本也从最初的几乎一年一次的12.1更新升级到了最新版本。
90年代Ansys版
虽然没有非常精确的比较,不同版本之间的计算速度也有差异,但是随着技术的创新,即使是同一个项目,使用更新的软件也可以更快更容易地完成。相当于变相升级电脑硬件性能。因此,如果可能的话,建议使用最新版本或者3-5年内的新版本。毕竟人的时间是最重要的成本。高效的硬件和软件,为用户提高效率,节省时间,是在买自己的命。让用户在有限的生命中,从进步和成长中获得比别人更多的收获。
4.2019年,我继续升级和改造我的工作站
2019年,随着对硬件性能和计算效率的需求越来越大,一台搭载志强8124处理器测试版和160G内存(买了192G内存但坏了一个插槽)、三块固态硬盘和二手高端专业显卡的工作站将再次自费上市。
在最后的24核工作站中,为了展现作者的DIY精神,购买了一台养鱼用的静音水泵,与本田思域汽车发动机散热器的软管水冷系统相匹配,成为仿真领域的一片流浪景观。为了保证简单方便,电脑更新回风冷方案,但散热器和导热硅脂几乎是业界最贵最强的机型,因为CPU功率也是世界同级别前240W。
三个固态硬盘在模拟时可读写500~800M/s,保证了极高的读写性能和不同计算需求的匹配。beta CPU花4000元买了3.3Ghz的18核,相当于官方版志强8124 3.5万元的性能。关于beta CPU 1.5%性价比的神话?
二手Quadro K6000显卡是几年前最高款。它打破了作者通常只用最破的显卡的诅咒。因为我准备试试ANSYS AIM和Live的新技术,顺便试试GPU加速的感觉。
虽然因为忙于AIM没用过几次,但是经过GPU加速测试发现了一个令人沮丧的结果。
比较不同计算量、计算模块、GPU是否开启、不同内核数量下求解时间的变化规律,发现GPU是否加速对结构计算根本没有好处。我建议你不要考虑这个计划。
原因如下:需要高端GPU甚至特定型号,大部分人使用的显卡,Geforce品牌,无论价格如何都无法使用(ANSYS Live除外),而这些新GPU的价格一般都在1万块以上甚至10万个档次,但对应模拟速度,没有明显的加速效果。一般增加10%左右,甚至有时会减慢10%-30%,极端情况下减慢300%。大价钱购买的硬件变成GPU减速卡,并不是很讽刺。
最近几天为了再提高10%的效率,8124处理器换成了26核3.2Ghz功率205w的新一代志强8272,花4万买官方版8272的性能也花了4000。beta XEON的性价比似乎杀了其他任何公司,其他型号,其他品牌的产品(AMD NO?)。这时候喊ES XEON YES更合适。
5.模拟工程师的高性能计算解决方案
当然,带志强3647接口的主板价格一般在2000元以上,对于预算紧张的用户来说不够好。低端配置推荐用beta I9-9900,8核4.3Ghz性能,功率100瓦以上,价格低至1500元,主板400元加散热器100元(这种社会动物不会给我100元?),总价2000,能满足大部分需求。
除非计算规模大到CPU支持的最大内存不够。而且由于内核少,模拟计算效率非常高,具有无与伦比的性价比。另一方面,10代I9性能提升有限,主板整体价格贵很多,不值得推荐。
大家分享一点购买CPU的经验。
首先定调子。西方超级计算机龙头企业克莱公司的创始人塞莫尔·克雷(seymor cray)曾说过一句名言:你要耕田,选两头壮牛还是1024只鸡?
按照电脑整体预算,购买CPU约占40%。在此基础上,在网上大致搜索所有价位相近的可选CPU型号,然后按照功耗由大到小排序。
作者坚信一个概念,就是在当今没有黑技术和跨界剧的CPU技术中,功率就是战斗力,功耗就是性能。耗电CPU一定是好CPU,省电CPU一定是性能差。
重点选择价格相近、架构相似的Top3功耗相近的CPU型号。但是仿真软件一般用多核加速,存在性能损失的问题。一般来说,结构计算在8核以内,计算时间与核数基本呈线性关系;8-16核的加速效率约为0.7,即2倍核的整体速度约为2X0.7=1.4倍;而16-32核逐渐加速效率下降,直到没有加速。这意味着其他条件保持不变,增加内核数量几乎不会提高整体速度。
建议结构模拟,越少越好(AMD胶水CPU 64核在厕所哭)。
当多个CPU互连时,存在通信引起的信号延迟。在CPU和主板的整体性能和价格不变的基础上,两个弱鸡CPU的实际性能是一个顶级CPU方案的90%左右。也就是说,对于结构仿真来说,以更高的价格购买双CPU主板和两个CPU及其散热器的性价比明显不如单CPU。
考虑到结构模拟的多核加速极限,基本30核,一个高端CPU就够了。除了不经常同时计算2-3个任务外,单CPU方案是一种更具性价比的选择。
综上所述进行结构模拟,总结如下:
对于内存,容量越大越好;对于CPU,拿出总预算的40%左右买CPU;
不买两只弱鸡就能买到一个极其强大的CPU
功率最高者性能强;核心最少者赢天下;对于固态硬盘,不是买不买而是买多大买多快的事情。对于显卡,最破的足够了,除非模型非常复杂,网格数量上千万及以上。不及物动词2020模拟知识周——我的公开课
本文从作者使用计算机和模拟软件的经验出发,分享了一些小故事和思考,希望能帮助大家,提高效率,加速成长,在自己有限的生命中击败更多的潜在竞争对手,筑起一条能力的护城河,不被侵犯,不被跨越。
总之,中国有句古话,不进则退。当别人在进步时,变得更聪明、更努力、更高效是一种被迫的选择。毕竟人性是懒惰的。如果你一无所有,谁想有才华?愿意和别人分享这篇文章。
2020年模拟知识周-5项福利收集
作者:刘晓恬《主机厂技术专家模拟秀》专栏作家
声明:原创文章,第一次模拟秀微信官方账号(ID:房真秀2018),部分图片来自网络,如有错误请联系我们,欢迎分享,未经允许严禁转载,转载请联系我们。
点击阅读原文,立即参与高性能计算直播
1.《2696v2 【今晚直播】与仿真软件的“斗争史",也是我的电脑硬件升级的“血泪史”》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《2696v2 【今晚直播】与仿真软件的“斗争史",也是我的电脑硬件升级的“血泪史”》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/shehui/1116080.html