当前位置:首页 > 娱乐星闻

银河突击队 国防科大“天河一号”:国之重器 超算英雄(图)

研究人员仔细检查每个系统节点。

1月9日,北京,人民大会堂。

国防科技大学“天河一号”获2014年国家科技进步奖特别奖。湖南涟源人、“天河一号”工程总指挥廖湘科作为2014年国家科技进步奖代表发言。

这是一个历史性的时刻。从1983年中国科学家成功研制出第一代“银河”超级计算机开始,经过几代中国科学家的艰苦探索,中国的超级计算机终于冲到了世界之巅,尽显王者风范。“天河一号”被誉为“全国最重的武器”。

这个光荣的WINNER的故事从耻辱的玻璃房子开始。

正式介绍

在国防科技大学,很多人都听说过玻璃房子的故事。

对于高性能电脑,欧美国家对中国实行了长期禁运,也成立了专门从事禁运的机构。80年代,中国气象部门想从美国克莱公司进口一台电脑,但美国人死活不肯卖。后来我终于松口了,但是美国政府不得不对出口到中国的高性能电脑进行监控,就是在机房安装监控仪器,把机器封在玻璃房里自己人监控,禁止中国科技人员进入。

2010年,国防科技大学超级计算机“天河一号”获得国际500强第一名。在接受新华社采访时,总设计师杨曾大谈自己亲眼看到玻璃房子的感受:“这段真实的历史,是中国科研工作者心中永远的痛。在中国土地上,外国人被‘技术门’拒之门外,就像农民家里没饭吃,母亲没奶喂孩子。”

面对西方国家如此严密的技术封锁,以慈云贵教授为代表的中国第一代计算机科学家坐不住了。国防科技大学计算机系和计算机研究所的创始人,带领国防科技大学计算机研究团队,于1983年12月研制出中国第一台十亿次巨型电子计算机,取名“银河”。从此,中国成为继美国、日本之后,能够自主设计制造超级计算机的国家。慈云归被誉为中国超级计算机之父。

从云贵到杨,短短几十年的中国超级计算,可以用杨的一句诗来形容:梦见天河,闪电巡陆十亿年。滨海坐地匆匆,倚天妙计。

当时,当我得知“天河一号”获得国际500强第一名时,杨说:“我们做了一些让自己满意的事情,做了一些让中国人骄傲的事情。”得到这首诗。

前奏

中国的超级计算总是比别人差一点点,让人心痛

90年代初,微处理器的出现导致了MPP整体技术的突破。人类计算机已经进入了超级计算机时代。国际战略家认为,“超级计算机已经成为国际竞争的战略领域。”

1993年,德国曼海姆大学的汉斯·埃里克教授开始实施国际500强排名。虽然纯粹是“民间活动”,但却释放出了强大的魅力,甚至赢得了政治家的青睐,日益演变成“高科技奥运”。

此时,国防科大Galaxy系列超级计算机的关键技术正在如火如荼的进行着。但每当中国跃上一个新台阶,美国或日本很快就会宣布研制出世界上最快的超级计算机。用那句台词的话说:“我们的超级计算机水平总是比别人差一点”。

虽然只是一点点,但在日益激烈的国际竞争中却大相径庭。在一篇即将在发表的报告文学中,作者龚评论了这“一点点”:

如果别人长得那么“高一点”,那就意味着站在“高峰”上,可以用俯视的眼光看世界;你这么“低”一点,说明你还在半山腰,只能抬头卑微别人!

别人只要高“一点点”,就可以狂妄地说“这个在中国不能卖给你”“那个在中国不能卖给你”,还可以告诉你怎么做,让你做这个,不让你做那个...总之,别人爱干嘛干嘛,你不喜欢别人!

这个“一点点”是套在中国人脖子上的“套索”,让人喘不过气来。

这个“一点点”是一把挂在中国人头上的“剑”,深深刺痛着中国人的心。

中国站在同一起跑线上,巅峰对决开始

21世纪,世界超级计算机的发展遇到了“冰封”时期。为了提高超级计算系统的整体性能,科学家们只能依靠增加系统规模:例如,计算机有几个足球场那么大,需要建造一个特殊的发电站来满足其功耗。2004年,日本的“地球模拟器”一度占据国际500强榜首,但它的机房实际上需要四层,铜缆长达数百公里。

超级计算技术需要新的架构理论来支撑。这也意味着,中国和美国、日本等发达国家处在同一起跑线上,是时候在超级计算领域打一场决战,冲击巅峰了!

经过反复论证,杨在国际上首次提出了异构融合架构技术。2006年,他带领R&D团队解决关键问题。杨担任行政领导、总工程师等多个职务,每周抽出两天时间与大家交流、讨论学术问题。晚饭时间过后,他买单,继续在饭桌上讨论。通常,和他的成员杨会带两个手机面板。一旦发现新东西就打电话讨论,经常在手机上烧耳朵。

2007年6月,杨带领团队完成了《64位流处理器体系结构研究》的研究论文,该论文在计算机系统体系结构国际会议上发表,并被国际权威期刊接受。这是ISCA承认的第一篇由中国学者独立完成的学术论文。也是中国人在计算机发展史上提出的第一个架构理论。

中国科学家为世界超级计算机技术突破“冰冻期”提供了全新的思维方式。中国和世界计算机强国之间的“巅峰”对抗已经开始。

两次袭击

“冒险”攻击:直接冲刺从每秒10万亿次到每秒1000万亿次

从2006年开始,杨和他的团队开始了一场极具创意甚至有点冒险的主动进攻。

当时国家制定了“先研制两百万台超级计算机,再研制一台千兆级超级计算机”的“两步走”战略。而以杨为总设计师的总工程师组,经过深入的技术研究和反复权衡利弊,决定直接从每秒10万亿次冲刺到每秒1000万亿次,走的是别人从来没有走过的CPU+GPU技术路线。这个非同寻常的决定引起了轩然大波。

以10倍的速度开发超级计算机已经成为国际惯例。从每秒10万亿次直接跳到每秒1000万亿次是不是有点太大了?然而,杨认为,虽然两步一步在世界上是罕见的,但对银河人来说并不新鲜。慈云贵带领大家开发王源-1远洋测量船中心电脑的时候,不是直接从每秒一万次冲刺到每秒一百万次吗?当今世界,超级计算机的性能每10年提高1000倍。在这种情况下,如果按所谓的“惯例”一步一步来,只能永远跟在别人后面。

野心再大,也需要实践检验。偏剑怪棋不太好。

CPU+GPU的异构集成架构,形象地说是将很多CPU和GPU有机地连接成一个“捆绑火箭”。

中国有句谚语:“一个和尚挑水喝,两个和尚挑水喝,三个和尚没水喝。”把几千个CPU和几千个GPU组合成一个“大庙”,还能硬“挑水”吗?

2009年3月,他们把CPU和GPU结合起来,发现总性能不到600亿倍,而一个CPU的性能接近500亿倍。也就是说,虽然GPU在图像处理上的速度惊人,但是把它和CPU放在一起进行科学计算就变得很懒,计算效率只有20%左右。

面对考试成绩,大家心里都凉了半截。听完情况汇报,杨向妻子招手:“你去把车开过来,带我出去走走。”当车驶出高速收费站时,杨拿出手机坚定地说:“别人不敢走的路,不代表自己不能走。从技术原理分析,通过软件优化可以大大提高GPU的计算性能……”

“特种兵”在长沙郊区封闭了半年

关键时刻,经学校党委推荐,时任中央军委主席的胡锦涛任命廖湘科为petascale超级计算机项目总指挥兼执行副总工程师。这个湖南籍的男人也是“虎将军”。1983年,当“银河一号”研制成功的消息传来时,正在清华读书的廖湘科和他的同学们立即南下长沙,亲眼目睹了创造历史的机器是什么样的。毕业后,廖湘科毫不犹豫地进入国防科技大学攻读硕士学位。用他的话说:“我刚去了‘银河’!”

面对挫折,杨、、不仅没有退缩,还做出了非同寻常的决定:将完成研发任务的时间节点从2010年底提前一年,即在2009年底前推出中国第一台千兆级超级计算机。很多人担心:“关键技术还没有突破,任务提前一年完成。能做到吗?”

总攻已经开始。位于长沙郊区的防汛指挥部——国防科技大学的超级计算机创新团队已经关闭半年了。

杨灿群带领的“突击队”在三层楼房里呆了一整天,试图调动GPU修士们的积极性,让他们从早上7点到午夜都能“挑水”,眼睛只盯着显示屏。

一连好几天没有任何成果,杨灿群在床上翻来覆去,闭上眼睛,满脑子都是波浪般翻滚的数据。突然,他隐约觉得眼前滚动的一些数据低于设计目标,爬起来跑到办公室打开电脑,进入实验数据库,发现GPU的一些计算资源没有被使用。兴奋之余,杨灿群立即着手优化程序。

杨灿群带领突击队乘胜追击,扩大战果。他连续奋战四个月,改进优化8万多次,创造了科学奇迹:GPU计算效率跃升至70%以上,达到世界最高水平!

张屠夫死后,中国人还是不吃带毛的猪!

没有时间再激动了,一个接一个的挑战来了。要实现每秒数十亿次运算,超级计算机系统不仅需要CPU和GPU“快速计算”,还需要一个快速平滑的网络系统,使各种信息“快速运行”。但在2009年7月的试运行中,发现由于GPU的稳定性不够,系统的稳定运行时间几乎不能超过半小时。“特种兵”想日夜解决GPU的稳定性,被称为petascale超级计算机通信网络“立交桥”的新切换方案又出了问题:芯片制造商美国技术工程师坚决反对他们的提议,拒绝支持。如果坚持走自己的设计路线,一切都要从零开始探索,创新是困难的,也是有风险的;如果我们完全按照美国的计划,我们可以肯定会成功,但没有创新或优势。

怎么办?

不信的银河人选择了前者。他们坚信,没有美国人的技术支持,中国人依然会做出新的开关:即使张屠夫死了,中国人依然不会吃带毛的猪!

短短10个月,他们研制出了一种新型开关,测得的技术指标大大超过了同类系统,成本是同规模产品的80%。

2009年国庆前夕,第一期超级计算机系统每十亿次安装。这时候,性能更高的新型GPU上市了,让大家兴奋不已,欣喜若狂。但是离任务节点只有一个月了,GPU更换必须拆开再重装。整个系统有2560多个节点,团队完成GPU更换一般需要半个月左右。整个团队二话不说,投入了男女老少的战斗,终于在三天三夜内完成了数千个GPU的更换工作。任务完成后,每个人的手上都盖着创可贴,一双眼睛熬红了。

三场决战

经过两天三夜的睡眠,发起新的挑战

2009年10月29日,中国第一台千兆级超级计算机横空出世空,中国成为世界上第一个掌握CPU+GPU异构集成架构技术的国家,也是第二个研制千兆级超级计算机的国家。时任中共中央总书记、国家主席、中央军委主席胡锦涛听到这个消息,亲自给她取名“天河”。

2009年11月18日,国际500强榜单出炉。“天河一号”获得世界第五,亚洲第一,这是中国机在500强排名中的最好成绩。十大机器中,9台美国制造,只有天河一号是中国制造。国防科技大学教授王宝生代表该队领奖时说:“感觉就像在奥运会上赢得了一枚大奖牌。像奥运会一样演奏中华人民共和国国歌,那就太美了。”

天河一号总工程师杨接到大洋彼岸的好消息后,放下手机,倒在床上睡了两天三夜。

作为一个在超级计算机前沿战斗多年的老兵,他知道在这个充满火药味的竞争领域,稍有懈怠,就会被别人超越甚至淘汰。2009年10月,国防科大计算机学院超级计算机创新团队召开天河一号系统二期动员大会,目标是每秒4700万亿次,必须用自己的CPU逐步改变微处理器依赖进口的局面。

“中国机器,外国核心”是一种说不出的遗憾,是中国人心中隐隐的痛。

许多同行专家对此深表钦佩和担忧:“一年之内,机器的性能将提高近三倍,除非发生奇迹。”

奇迹真的发生了。

2010年11月,在世界超级计算大会上,“天河一号”二期系统以其计算峰值比第二名——“美洲虎”高出一倍多的绝对优势获得国际500强第一名,打破了美国在超级计算机领域的长期霸主地位,标志着我国自主研发的超级计算机综合技术水平进入世界领先行列。

玩过几个《上甘岭》

这样的奇迹,来源于超越常人的超级大胆和艰辛。参与者表示,他们真的玩过几款“上甘岭”游戏。比如通信光纤的防御。

通信光纤的铺设是“天河一号”二期系统进入国家超级计算天津中心的一期工程,时间紧,任务重。为了保证施工任务如期完成,指挥员把任务细化到天,要求大家“任务没完成当天不吃不睡”。

我不知道有些是刚开工第一天就铺好的。施工指挥拿起一看,顿时目瞪口呆:光纤的绝缘橡胶磨破了,有裂缝,光纤的芯部有些地方露出来了。原来是沟的水泥面太粗糙,盛夏沟温高达40度,所以光纤保温层烤得像细骨一样,可以承受水泥地面的破坏。这个问题不解决,后果不堪设想。信号会中断,通信会短路,系统会紊乱。

如何避免光纤绝缘层损坏?大家绞尽脑汁也没有想出办法。指挥官擦了擦脸上的汗,拍了拍大腿:“有办法!”

我看见他脱下衬衫和裤子,跳进闷热的阴沟里,趴在粗糙的水泥地上。大家一看到,马上就明白了指挥官的意思。没有任何人的命令,他们脱下衣服,跳进阴沟里,铺上一张光滑的“人毯”!

一根光纤沿着官兵光滑的皮肤平滑地向前延伸。官兵的血肉在滚烫的水泥地上被烤焦了,每个人都满身是汗和污垢。

肉都磨破了,伤口还在流血,没有人退缩...

天津滨海新区一位领导看到这一幕非常感动。“在战争年代,我们的士兵用他们的血肉堵住漏洞,炸毁碉堡,为民族独立和人民解放而战。和平年代,人民军队跳入洪流,堵住大堤,冒着地震,抢救人民。今天看到我军科研人员光着屁股躺在阴沟里,汗流浃背,血流不止,不撤退,为了保护科研设备。人民军队的光荣传统没有在你身上丧失!我们国家有这样的研究团队,就算是再难的项目也能拿下!”

几十个人光着身子光着背在粗糙闷热的战壕里爬了几十天,被坚硬的混凝土和光纤划得遍体鳞伤。但是15000根光纤毫发无损。

天河一号二期系统调试当天,机器一开机,所有通讯线路就畅通了。国家超级计算天津中心领导特意看了看官兵背上尚未愈合的伤口,感慨道:“天河一号二期系统首测顺利,有你的贡献!信用本上,有大家族的名字!”

尾声

2015年1月7日,国防科技大学天河楼4楼长沙。

上午9点,计算机学院教授、博士生导师陆钰彤穿着笔挺的军装来到办公室。前一天晚上,她加班到晚上十点半。作为天河的总设计师,陆钰彤早就习惯了这种工作模式。她告诉三相都市报记者,“开发天河一号和天河二号的时候,加班熬夜是常事。我们称之为‘五加二,白加黑’。”

陆钰彤,皮肤白皙,身材修长,是国防科技大学著名的美容学家,天河R&D队为数不多的女性之一。1983年Galaxy开发成功的时候,这个年轻的长沙女孩向往着这个“Galaxy-我出生的地方”,在国防科技大学从本科到博士。

和、陆钰彤一样,越来越多的年轻人因为银河一号、天河一号来到这里,2010年天河一号夺冠时,整个天河队的平均年龄只有30岁,总设计师杨只有46岁。

半年后,天河一号被日本的“京”超越。此后,美国红杉和泰坦先后获得第一名。但从2013年6月到2014年11月,“天河二号”连续四次排名第一,获得“四连冠”。

天河一号的管理者和运营者刘光明对比天河一号和天河二号:“天河一号”运营一个小时,相当于13亿人同时用计算器算340年;天河二号一个小时的运行相当于13亿人算1000年。

在超级计算机的国际竞争战略领域,巅峰对抗永无止境,中国已经将王者风范镌刻在史册上。

■特约撰稿人龚记者严平照片由龚提供

科普

天河超级计算机能做什么?

算上天、地、人...

2015年1月9日,“天河一号”超级计算机获得2014年国家科技进步奖特别奖。超级计算机有什么神奇之处?它和我们的生活有什么关系?

“超级计算机计算天空,计算土地,计算人,计算过去,计算现在,计算未来...利用超级计算在地球上做CT,可以快速准确的找到石油;用超级计算分析人类基因可以解读生命的奥秘……”

国家超级计算中心主任刘光明这样解释超级计算。超级计算已经进入各行各业,千家万户,人们的衣、食、住、行、乐无时无刻不在分享着超级计算机计算的“红利”。

数数日子:飞机为什么能飞得更高更快?

航空空航空航天是大国竞争的焦点。“天河一号”是我国大型航天航空飞机设计空气动仿真和新型发动机开发的重要平台。例如,使用超级计算作为风洞,设计的飞机可以飞得更快、更高、更省油。

超级计算也可以帮助控制大气烟雾。为了摸清雾霾形成的区域、过程及相关因素,建立相关模型,做出准确预测,中国气象科学研究院、国家气象中心、清华大学、国家超级计算天津中心等机构通力合作,利用天河一号10%-20%的计算资源,建立并完善了数字模拟模型。目前,该研究取得了关键进展,有望在三到五年内对雾霾气候做出准确预测,为国家制定区域发展规划提供相关评估数据。

计算土地:给地球一个CT找油

油呢?当人们想到这个问题时,就会出现地质勘探人员背着沉重的设备,用小锤子在河湖岸边的岩石间敲打的场景。超级计算技术已经把这种独创的“找油”方法送到了历史博物馆。人们利用超级计算机科学计算人工地震波的反射数据,建立大规模三维地质模型,可以恢复某一地区的地质结构,进而确定石油天然气的具体方位和储量。电脑运行越快,探索就越快越准。

天河石油地球物理计算中心以中石油、中石化、中海油为重点,搭建了完善的地震地球物理数据处理和地球物理信息管理平台,大力开展石油地球物理数据处理的开发和应用,成功设计了具有完全自主知识产权的石油三维偏移软件,扭转了该领域受制于人的局面,促进了产业技术进步和协同创新。

清点人数:生物医学的新革命

天津国际生物医学联合研究所的科学家说:“过去我们研究开发一种新药,要投入10亿美元,进行10万次化合物筛选,历时10年。现在我们用‘天河一号’筛选一周,可以完成过去一年的筛选量,大大缩短研发周期,降低研发成本,为新药研发提供新思路。高性能计算在药物研发中的应用是医药行业的一场革命。”

中科院上海药物研究所的科学家也通过计算模拟与药物实验相结合的方式,在天河一号上确认了一个全新的药物作用位点。药物设计直接在天津超级计算中心进行,不经过任何化学作用,就获得了一种对某种疾病有显著疗效的药物。在“天河二号”上,他们对75万种小分子化合物进行了亲和力评价,完成了600多种药物的体内外活性试验,为人类治疗恶性肿瘤、乙肝、糖尿病等慢性病提供了一种新的途径。

计算过去和计算未来:探索我们的星球

几万年前和几亿年前人类居住的星球是什么样的?它是怎么变成今天这个样子的?要解开每个地球的奥秘,必须依靠超级计算机进行数值模拟,全面系统地研究各种物理、化学、生物变化过程。天河一号已经成为中科院大气物理研究所、国家海洋局、国家气象局的研发模拟平台。通过模拟全球气候变化和海洋环境变化,对人类未来的生存环境有一定的认识,为保障人类社会的可持续发展提供科学数据。

■特约撰稿人龚记者李婷婷

1.《银河突击队 国防科大“天河一号”:国之重器 超算英雄(图)》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《银河突击队 国防科大“天河一号”:国之重器 超算英雄(图)》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/yule/1341867.html

上一篇

冰虾可以直接吃吗

下一篇

广西一女局长坠亡 到底是什么状况?

银河一号 国防科大“天河一号”:国之重器 超算英雄(图)

银河一号 国防科大“天河一号”:国之重器 超算英雄(图)

研究人员仔细检查每个系统节点。1月9日,北京,人民大会堂。国防科技大学“天河一号”获2014年国家科技进步奖特别奖。湖南涟源人、“天河一号”工程总指挥廖湘科作为2014年国家科技进步奖代表发言。这是一个历史性的时刻。从1983年中国科学家成功研制出第一代“银河”超级计算机开始,...

计算机板块 大跌之后再看科技,谈谈计算机和消费电子的机会

计算机板块 大跌之后再看科技,谈谈计算机和消费电子的机会

昨日,美股再度暴跌3%。今天a股终于顶不住压力了。上证指数下跌0.8%,深成指下跌3%,创业板暴跌4.6%,前期强势的半导体50基金几乎一蹶不振。崩盘后,大家没必要对科技失去信心。今年5G和国内替代的逻辑是存在的。5G还在基站建设期,离商用还很...

计算机语言分为哪三类 计算机中的语言可分为哪几种

  • 计算机语言分为哪三类 计算机中的语言可分为哪几种
  • 计算机语言分为哪三类 计算机中的语言可分为哪几种
  • 计算机语言分为哪三类 计算机中的语言可分为哪几种
蔡澜越南粉 蔡澜pho越南河粉广州首店进驻天河万菱汇

蔡澜越南粉 蔡澜pho越南河粉广州首店进驻天河万菱汇

联合商报:11月8日,广州首家pho越南米粉店在蔡澜进入广州天河万灵汇。   [蔡澜pho]是美食蔡澜创立的品牌。餐厅涵盖越南菜,如河粉、柠檬粉、小吃、甜点、饮料等。自2018年香港中环兰桂坊开业以来,倪匡和他的妻子、艺术家陈奕迅、陈慧琳、米歇尔·莫妮克·赖斯以及许多其他名人都...

蔡澜pho 蔡澜pho越南河粉广州首店进驻天河万菱汇

蔡澜pho 蔡澜pho越南河粉广州首店进驻天河万菱汇

联合商报:11月8日,广州首家pho越南米粉店在蔡澜进入广州天河万灵汇。   [·蔡澜·福]是美食蔡澜创立的品牌。餐厅涵盖越南菜,如河粉、柠檬粉、小吃、甜点、饮料等。自2018年香港中环兰桂坊开业以来,倪匡和他的妻子、艺术家陈奕迅、陈慧琳、米歇尔·莫妮克·赖斯以及许多其他名人都...

计算机设计大赛 计算机设计大赛|谁与争锋!

计算机设计大赛 计算机设计大赛|谁与争锋!

设计 计算机设计竞赛 ●○●计算机设计竞赛 ● ○ ● 党党·党党~ 看那些小的。 大家都等了很久了 计算机设计竞赛 开始 然后 大新会带你参加这个比赛 让我们看看! 计算机设计竞赛综述 主动对象  四川旅游学院全体学生 主办单位  四川旅游学...

天河企康 天河丨石牌动态:六个菜市场全部复工!培训机构暂停线下培训

  • 天河企康 天河丨石牌动态:六个菜市场全部复工!培训机构暂停线下培训
  • 天河企康 天河丨石牌动态:六个菜市场全部复工!培训机构暂停线下培训
  • 天河企康 天河丨石牌动态:六个菜市场全部复工!培训机构暂停线下培训

中国首个量子计算机操作系统发布 到底是什么样子

中国首个量子计算机操作系统发布 2月8日晚,合肥本源量子计算科技有限责任公司(下简称“本源量子”)发布首款国产量子计算机操作系统——本源司南。  据介绍,该系统全面超越现有产品(例如英国Deltaflow.OS量子计算机操作系统, 奥地利ParityOS量子计算机操作系统),实现量子资源系...