航空航天港

 找回密码
 注册会员

QQ登录

只需一步,快速开始

查看: 9857|回复: 83
收起左侧

[电子信息技术] 国产超级计算机专题

[复制链接]
空弹匣 发表于 2015-7-13 13:25 | 显示全部楼层 |阅读模式

对本站感兴趣的话,马上注册成为会员吧,我们将为你提供更专业的资讯和服务,欢迎您的加入!

您需要 登录 才可以下载或查看,没有帐号?注册会员

x
中国已开始研发“十亿亿次”超级计算机
2015年07月13日 09:31 http://mil.news.sina.com.cn/2015-07-13/0931834972.html
 高性能计算机是一个国家综合科技实力的体现。曙光公司总裁历军近日在接受记者采访时表示,继千万亿次超级计算机曙光“星云”之后,“十亿亿次”超级计算机曙光7000已开始研发。
 历军介绍说,曙光7000是曙光公司为适应未来市场需求设计的新一代超级计算机系统,从处理器、高速通信网络、大规模存储系统、系统软件到应用软件全面采用自主技术,安全可控。

  “曙光7000不是通用机,它是为某种应用而量身定制的大型机,要想‘吃透’应用,难度很大,周期会很长。”历军说。

  历军同时表示,作为国内高性能计算机领军企业,近年来,曙光公司一直注重高性能计算的应用,并正在逐步向云计算服务提供商迈进。转型后,曙光将成为“信息+数据管理”服务供应商,并通过合作伙伴形成应用生态系统,构建覆盖全国的信息化、大数据管理服务网络。

  “截至目前,曙光已经在无锡、深圳、重庆等全国10个城市建设了云计算中心试点。从试点的效果来看,确实给城市的管理能力带来大幅度提升,发挥了重要作用。”历军说。

  以中国科学院计算所等机构为技术依托的曙光公司,成立于1996年,实现国产高性能计算机的产业化生产,构建起集研发、设计、制造于一体的服务器产业链。2008年,该公司推出了我国首款百万亿次超级计算机。

StdNormDist 发表于 2015-7-13 17:07 | 显示全部楼层
汇总相关信息
全球首台云计算机“紫云1000”在中国诞生


“十亿亿次”超级计算机
记得在天河二号的相关新闻里,很多新闻说的是“33.86千万亿次”(千万亿,10^15),应该改成“3.386亿亿次”,每两个“万”进为一个“亿”


另外,LZ转载文章时可以把外面的边框去掉,简洁一点
zmic 发表于 2015-7-19 22:42 | 显示全部楼层
不知CPU用的是哪一家的?还是Intel的?
火星居士 发表于 2015-7-20 09:10 | 显示全部楼层
zmic 发表于 2015-7-19 22:42
不知CPU用的是哪一家的?还是Intel的?

前两天美国不是刚封锁么?
saeylet 发表于 2015-7-20 17:02 | 显示全部楼层


天河-2A是天河-2升级版





kanjia 发表于 2015-7-29 09:58 | 显示全部楼层
我超级计算机将助力“天眼”探测宇宙边缘

发表时间:2015-07-29 08:42来源:科技日报

    记者28日从中科曙光公司获悉,作为我国高性能计算领军企业,这家公司将在黔南超级计算中心部署千万亿次超级计算机“天眼一号”,助力我国在建的世界上最大的单口径射电望远镜探测百亿光年外信息。

    作为我国九大科技基础设施之一,这只被喻为中国“天眼”的超级望远镜(简称FAST)单口径500米,接收面积相当于30个足球场,于2011年预计2016年建成。投入使用后,我国空间测控能力将由月球同步轨道延伸到太阳系外缘。这意味着,远在百亿光年外的射电信号,FAST也有可能捕捉到。

    鉴于FAST的海量数据存储和处理均需要强大的超级计算系统的支撑,为推动FAST工程的建设,中科院计算所、天眼集团和中科曙光三方签署了战略合作协议,将共同建设与FAST工程配套的黔南超级计算中心。

    据中科曙光公司介绍,FAST的重要科学目标“脉冲星巡天”和“中性氢谱线巡天”有着“天文级”的数据存储要求和高效精密的计算要求。中科院计算技术研究所高性能计算机研究中心主任张佩珩表示,建成后,FAST每天需求的峰值计算至少要达到每秒200万亿次以上,存储将达到10PB以上。

    面对未来FAST在这方面庞大的数据需求,中科曙光副总裁任京旸介绍说,“天眼一号”计算能力将达到每秒1000万亿次以上,将配备先进的分布式数据存储技术以及高达100Gb/s的高速网络,不仅可以充分满足项目的需求,而且具有低功耗、低成本、高密度和快速交付等特点,为海量数据的高速传输和分析提供条件。
 楼主| 空弹匣 发表于 2015-8-1 15:35 | 显示全部楼层
美要造超级计算机之王 速度超“天河二号”30倍
2015-08-01 07:31 http://news.qq.com/a/20150801/006444.htm
美国要造“超级计算机之王”计算速度超中国“天河二号”30倍

【环球时报综合报道】美国总统奥巴马本周三签署一项行政命令,要求美国在2025年造出世界上最快的计算机,计算速度达到每秒100亿亿次。

目前世界上运算速度最快的计算机系统为中国的“天河二号”,持续计算速度为每秒3.39亿亿次、峰值计算速度为每秒5.49亿亿次。如果美国超级计算机研制成功,将比目前“天河二号”在持续计算速度上几乎快30倍、在峰值计算速度上几乎快20倍,成为“世界超级机算机之王”。

舆论普遍认为“美国这一最新举措的明显企图,就是在这一领域中挑战中国的霸主地位”。“不做老二是美国的国家信仰”,中国人民大学国际关系学院教授王义桅昨日对《环球时报》表示,“天河二号”连续几年保持世界运算速度第一的纪录,对美国“是相当有压力的”,“美国的国家安全感就建立在和对手拉开差距上”
 楼主| 空弹匣 发表于 2015-9-25 13:59 | 显示全部楼层
中国将建超级计算机 专门用于模拟整个地球环境
发表时间:2015-09-25 10:02:18 http://www.guancha.cn/Science/2015_09_25_335584.shtml

在一个约两层楼高、形如魔方、嗡嗡作响的超级计算机里,中国科学家要计算出地球未来的气候变化。

从一朵云的发展,到地球百年、千年甚至上万年后的气候变化,科学家都希望能够通过被称为“地球数值模拟装置”计算出来。

23日,中国科学院大气物理研究所、曙光信息产业(北京)有限公司、中科院计算技术研究所、中科院计算机网络信息中心联合发布了“地球数值模拟装置”的预研和原型系统。这套基于中科院地球系统模式1.0版本的高性能计算机系统的落成,填补了中国地球系统模式大数据实践平台的空白。

“地球数值模拟装置”的原型系统已经落成,其硬件规模是未来工程的1/10,用于硬件和软件的测试

这个坐落于北京中关村软件园内的边长约5.4米的深蓝色立方体,是未来中国“地球数值模拟装置”的缩小版,它包含高性能计算机硬件、地球数值模拟应用软件、并行软件支撑框架、可视化系统等多个部分,可满足对地球系统的仿真研究。科学家可借助该系统,在地球系统模式研发、短期气候预测、灰霾治理等方面得出成果。

中国工程院院士、中国气象局国家气候中心专家丁一汇说,这是中国研究地球模拟器的重大进展,是非常了不起的基础性工作,将为天气和气候一体化研究提供坚实基础。

地球的大气圈、水圈、生物圈等多个圈层要在一个系统下非常科学合理的耦合。“地球外的系统对我们也有影响,这个可以模拟地球自身以及外太空宇宙射线、太阳风等影响的装置非常强大,能够帮助我们研究未来至少30年的环境变化、PM2.5变化,对于削减温室气体,彻底改善环境都将起到重要作用。”丁一汇说。

原型系统的内部硬件

作为“地球数值模拟装置”的软件,“地球系统模式1.0版本”是23日发布的一大亮点。据中科院大气物理所研究员张明华介绍,这套软件包含了完整的气候系统和生态环境系统分量,集成了大气、海洋、海冰、陆面水文、大气化学和气溶胶、动力学植被、海洋生物地球化学等子系统模式或分量模块,并通过一个通量耦合器实现各模块之间的完整耦合,可以更加逼真地实现对大气、洋流、陆面过程、生态等的仿真研究。

曙光信息产业股份有限公司总裁助理曹振南说,地球系统模拟对计算机的性能要求非常高,很多世界排名前几位的高性能计算机都用于地球系统模拟。

据介绍,中国科学院、中科院大气所、中科院计算技术所、中科院网络中心、中科曙光等几家单位共出资0.9亿元为该项目建设了专用计算机,其峰值计算能力不低于每秒1千万亿次,计算能力目前进入中国前十位;其存储总容量大于5PB;并针对性地对系统进行了地球系统数值模拟加速计算和软件性能优化。

中科院大气物理所研究员张明华介绍“地球系统模式1.0”软件

中科院大气物理所信息中心主任周广庆说,用目前这个原型系统,一天可以计算出地球的大气圈、水圈、岩土圈、生物圈等多个圈层6年的变化。

中科院大气物理所所长朱江说,中国科学家自主研制的软件在硬件上运行,目前测试结果很好,接下来将进一步优化。希望未来真正的“地球数值模拟装置”建成后,运算速度和精度都能提高十倍以上。

根据中国气象局资料统计,在各类自然灾害中,与气候直接相关的大约占到70%以上。中国每年重大气候灾害影响的人口大约达4亿人次,所造成的经济损失大约占到国民生产总值的1%至3%。

科学家说,气候和环境危机无法准确预测的关键在于人们对地球系统变化和运动规律认识的局限性,需要从系统的角度来进行地球各圈层自身的演化规律及其它们之间的相互作用规律的研究。因此,地球系统科学应运而生。

据介绍,美、日、欧等发达国家已建有软硬件结合的面向地球系统的专门模拟装置。而由于中国尚缺乏面向地球系统专用的数值模拟装置,使中国地球系统模式的研制和气候变化模拟研究受到很大制约,研究结果科学支撑能力不足,导致在国际外交谈判时话语权微弱。

“我们需要有自己的计算数据作为谈判依据,以提升我国在气候与环境领域的国际话语权。”中国科学院院士曾庆存说。中国已将“地球系统数值模拟装置”纳入“十二五”大科学装置建设规划。

 楼主| 空弹匣 发表于 2015-11-16 10:38 | 显示全部楼层
张云泉:美国禁售CPU不会对中国超算发展造成影响
中国计算机学会高性能计算专业委员会秘书长
发表时间:2015-11-15 08:40:05 http://www.guancha.cn/zhangyunquan/2015_11_15_341339.shtml
【天河、曙光、神威是中国超级计算机的骄傲。但一直以来,因天河2号、曙光6000使用美国CPU而遭到的质疑和抹黑不绝于耳,在美国对中国禁售至强PHI计算卡后,一些人更是“忧心忡忡”的表示中国超算要完蛋了。
就在美国对华禁售用于超算的至强PHI后,国防科大先后对外发布勒“火星”和矩阵2000。国防科大自主研发的芯片能否让美国的技术封锁成为笑话,让国外技术封锁后自主技术突破的历史再次上演?
11月10日至11月12日,HPC China 2015大会在无锡召开,观察者网专访HPC China 2015大会副主席、中国计算机学会高性能计算专业委员会秘书长张云泉,明确美国禁售CPU不会对中国超算发展造成多大影响,并揭示中国超算发展的现状。】

观察者网:能简单介绍下HPC China 2015大会吗?
张云泉:本次大会的参会人数首次突破了1000人,到会代表也更加广泛,主要的研讨主题是超级计算机和大数据的融合问题,特别是如何在体系结构上和软件研发上应对大数据带来的挑战。
观察者网:能具体说说是什么样的挑战吗?
张云泉:大数据作为新的一种应用类型,虽然在过去超算的体系结构设计上也曾经考虑过这个应用类型,但并没有落实,所以超算在做大数据处理的时候会显得效率很低,怎样在体系架构、系统软件和算法软件方面做创新,使超算能够同时支撑科学计算和大数据两种应用,现在是一个很热的话题。
观察者网:科学计算和大数据处理各重视哪方面的性能?
张云泉:科学计算比较重视超算的双精浮点性能;大数据处理则比较重视I/O输出、存储访问的速度、整数计算和逻辑计算性能。

观察者网:网络上有一种声音,认为天河2号使用Intel的CPU,所以中国超算技术就是拿别人的CPU的组装货,没有什么技术含量,您对这个说法怎么看?
张云泉:这个说法是不太科学的。CPU是超算的重要组成部分,但不是超算的全部。超算由大量的计算节点组成,每个计算节点由一些CPU组成,计算节点由高速互联网络连接起来,另外,还有大规模存储系统、系统软件、应用软件和冷却系统等方面,像天河2号,除了计算节点用的CPU是美国Intel公司的,其他部分全部都是国人自己做的。
观察者网:那对网络上非议中国超算的声音,您怎么看?
张云泉:现在发展的形势总体不错,但有些人不满意是正常的。在现在全球分工的时代,很难做到任何事情全部都自己做,最关键的是核心技术必须自己掌握,就像最近下线的C919大飞机,整体设计、气动外形是自己做的。超算也是一样,关键是框架设计必须自己做。当然,全国产虽然很难,但并非做不到。
观察者网:有人认为只要有钱,买更多的CPU就能堆出比天河2号性能高好的超算,您对这个看法怎么看?
张云泉:这个说法有待商榷。因为堆CPU也是一个技术活,体系架构设计的不好,高速互联网络做的不行,系统软件做的不好,储存列阵做的不行,即使堆再多的CPU,超算的性能也上不去,而且还有功耗问题和稳定性问题,哪怕性能上去了,每隔几秒出一次错,这种事情没有一个超算用户能受得了。
观察者网:也就是说CPU其实并非很多人想象的那样是超算全部核心技术?
张云泉:是的,体系架构、互联网络、处理器、存储、系统软件、应用软件、功耗制冷、可靠性等方面都是超算的核心技术,处理器只是其中之一。
观察者网:美国禁售至强PHI会对天河2号的升级造成阻碍吗?
张云泉:基本没有什么影响,中国完全可以自己做。过去天河超算的高速通信网络、大规模存储系统都是自己做的,系统软件和应用软件大多是自己编写或在国外开源软件的基础上深度定制,因此在这方面不存在技术障碍。
观察者网:您对美国禁运怎么看?
张云泉:像现在CPU、高速互联网络美国都是禁运的。其实,中国也不怕禁运,越禁运越坚定我们做自主技术的信心,对做出自主技术越有利。
观察者网:美国禁运后很多原本想捣乱的人也没机会捣乱了?
张云泉:对。这使我们能更好的集中资源和精力做自主技术。
观察者网:在CPU方面中国有替代品么?
张云泉:有。在CPU方面中国也有自己的替代产品,比如国防科大的矩阵2000(GPDSP,因为数字信号处理器有比较高的双精浮点性能,被用来作为超算的加速器——观察者网注)就可以替代Intel的至强PHI计算卡。CPU只是超算的一个重要组成部分,不要把超算等同于CPU的堆积。如果硬要说美国禁售对天河超算造成影响的话,那也只是对天河超算升级的时间造成了延误。
观察者网:用国防科大的DSP做加速器和用英伟达的GPU做加速器以及Intel的众核芯片做加速器有什么区别?
张云泉:在性能方面,这些加速器差别不是很大,到底用那种加速器,主要取决于机器的应用目标是什么,考虑用户的易用性,机器的功耗大小和日后运营的成本,编程的难度和是否能找到数量足够,又会相应技能的程序员,还取决于是否能够采购到相应的加速器以及采购的成本和市场前景。当然现在美国禁运后,坚定了我们用国产DSP替代美国计算卡的决心,这其实也是好事。
观察者网:GPDSP能跑openCL和openMP吗?(openMP是编译器指令,面向共享内存系统,众核和多核。openCL是编程框架+编程语言+编程API的组合,面向的范围很广,主要面向异构计算。两者面向的架构不完全一样。当然openCL也能支持openMP的架构,但openMP支持不了openCL的众核架构。)
张云泉:GPDSP能跑openCL。
观察者网:一些资料上说扩充一些GPDSP编译指导语句,也能跑openMP?
张云泉:目前还很难做到,即使跑起来也够呛。
观察者网:也就是说,使用国产DSP做加速器后,编程难度会变大?
张云泉:会增加一些,毕竟GPDSP过去没人做过,国内外都没有技术积累,很多方面国内要从零开始积累。

观察者网:目前,中国天河2A正在升级之中,能说说具体升级计划么?
张云泉:天河2A计划用矩阵2000替代美国至强PHI计算卡,因保留了天河2号的主体I/O结构,计算节点处理器依旧使用E5-2692 V2,计算节点增加到18000个,按照一个计算节点需要2个E5和3个加速器来计算,天河2A需要36000片E5和54000片矩阵2000,理论浮点峰值将超过100P。

观察者网:现在超算主要应用在哪些方面?
张云泉:在气候气象、海洋环境、数值风洞、碰撞仿真、蛋白质折叠、基因研究、新药研发、分子动力学模拟、量子化学计算、材料科学、芯片设计、动漫设计、工业设计等方面用途广泛。
观察者网:根据网络消息,美国新一代超算四台超算性能都在100P以上,能谈谈美国对超算的应用么?
张云泉:美国超算主要用于核武器模拟,国家信息安全,全球气候变化模拟,新药研制,气象预报,新材料模拟,空气动力学,生物信息学等领域。
观察者网:中国新一代超算能够与美国新一代超算匹敌么?
张云泉:中国新一代超算在性能上是可以与美国超算匹敌的,但在实际应用水平上还有差距。
(采访:铁流)
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。
 楼主| 空弹匣 发表于 2015-11-17 08:35 | 显示全部楼层
天河二号六度称雄全球超级计算机500强 美国降至最低仍201台
发表时间:2015-11-17 07:27:43 http://www.guancha.cn/Industry/2015_11_17_341527.shtml
如果说大嘴特朗普(Donald Trump)还需要其它证据来表明美国不再“伟大”的话,那么他完全可以拿“超级计算机”来说事。自从2013年以来,中国的“天河二号”超级计算机就一直雄居全球超级计算机500强榜单之首。在11月16日公布的新一期全球超级计算机500强榜单中,“天河二号”超级计算机再度称雄,这也是此计算机连续第六次称雄。另一个引人注目的变化是,中国入围这一榜单的超算数量比上期激增了近2倍,而美国上榜数量却降至历史最低水平,但仍有201台上榜。
点击查看大图
天河二号超级计算机(资料图)
中国大陆超算上榜数大增
据国际TOP500组织当天发布的榜单,第一名“天河二号”的浮点运算速度为每秒33.86千万亿次,第二名美国“泰坦”的浮点运算速度为每秒17.59千万亿次。第三名至第五名依次为美国“红杉”、日本“京”和美国“米拉”超级计算机。实际上,这5台超级计算机的排名自2013年6月以来就没有变化。
排行榜主要编撰人、美国田纳西大学计算机学教授杰克•唐加拉对新华社记者说:“榜单前5强非常强大,造价也非常高,可能还需要一年时间才会有一台新的超算系统进入其中。”
此次榜单最大的变化就是,美国入围数量虽然相对其他国家依然优势明显,但已从今年7月的231台降至此次的201台,是该榜单1993年发布以来美国上榜数量的最低水平。与此相反,中国大陆超算的上榜数量出现大幅增长,从半年前的37台增至现在的109台,多于欧洲的上榜超算总数107台。
中国在超算领域的进步不仅表现在上榜数量方面,还体现在生产制造领域。
在此次榜单中,中科曙光的超算系统入围49台,超过传统超算巨头IBM公司的45台,位居惠普公司的156台和克雷公司的69台之后。
中国联想超算系统入围25台。由于联想去年收购IBM的X86服务器业务,一些原本属于IBM的超算系统现在改标为IBM/联想(9台)或联想/IBM(5台)。但这些并不包括在联想上榜的25台超算之内。另外,浪潮也有15台超算上榜。
专家否认中国超算领域存在过热问题
对于中国超算的迅速增长,该排行榜的主要编撰人、美国田纳西大学计算机学教授杰克·唐加拉对新华社记者说,这主要是中科曙光、联想和浪潮这3家中国公司共同发力的结果,其中高性能计算机生产商中科曙光提供了中方大部分超算系统。
TOP500组织的一份声明写道:“随着多家中国生产商在高性能计算机领域日益活跃,中国企业作为生产商正在占据这一领域的更大份额。”
美国加利福尼亚大学河边分校的超级计算实验室负责人陈子忠认为,这一进步“是中国计算机专家长期努力的结果。这表明,中国与美国在综合国力上的差距越来越小”。
关于迅速增多的中国超级计算机能否得到有效利用的问题,唐加拉的看法是,超级计算机是一种复杂工具,需要对人员进行高级培训才能有效利用,“这一过程需要时间”。
陈子忠指出,中国在超算领域没有过热的问题。目前,中国在超算的硬件方面与国外的差距正越来越小,但在超算的软件研制、应用开发和人才培养方面还有待进一步提高。如果超算软件人才不足,就有可能导致部分超算硬件的利用效益不高。
商英特尔公司称世上没有超算专用芯片
今年年初,美国政府曾把与超级计算机相关的4家中国机构列入限制出口名单。在这种情况下,为何中国上榜全球超算500强名单的数量不降反升?
陈子忠解释说,上述禁令并未禁止中国整个行业使用美国企业制造的芯片。芯片制造商英特尔公司的一名发言人对新华社记者说,其实并没有什么超算专用芯片,“天河二号”使用了英特尔的至强(Xeon)处理器和Xeon Phi协处理器,这是非常普通的产品,全世界的电脑商店都可以买到。
专家称美国超算领域领先地位依然稳固
专家还认为,虽然此次美国超算的上榜数量降至历史最低,但美国在超算领域的世界领先地位依然稳固。
今年7月,美国启动“国家战略计算计划”,目标是到2025年建造世界上运算最快的计算机,其运算速度将达到每秒100亿亿次,相当于“天河二号”运算速度的30倍。此前,美国还宣布在2017年前后建造数台运算速度是“天河二号”3到5倍的超级计算机。
唐加拉认为,美国“国家战略计算计划”揭示了高性能计算的未来发展,“表明高性能计算很重要,应该严肃对待”。
陈子忠表示,某个国家如果没有与超算研发相对应的计划,那么该国与超算领域领先国家的差距可能会拉大。“虽然美国在TOP500榜单上的超算系统数目不会大幅增加,但美国在超算领域的综合实力会更加强大,其领先地位仍会比较牢固”。
他建议,为保持在超算领域的竞争力,中国需要研发自己的高性能芯片,开发自己的超算系统软件和应用软件,并加强超算人才的培养。
TOP500榜单是对全球已安装的超级计算机“排座次”的权威排行榜。从1993年起,由TOP500国际组织以实测计算速度为基准每半年发布一次。
新闻背景
“数”说全球超算500强排行榜
1 自2013年6月以来,该排行榜前5名没有变化,依次是中国“天河二号”、美国“泰坦”、美国“红杉”、日本“京”和美国“米拉”超级计算机。
2 榜单前10名出现两个“新面孔”,分别是排名第六的“三一”和排名第八的“花尾榛鸡”。“三一”超算由美国能源部下属洛斯阿拉莫斯与桑迪亚两个国家实验室共同管理运营;“花尾榛鸡”超算则安装在德国斯图加特大学高性能计算研究中心。
3 从总数看,美国以201台占据榜首,但已降至自1993年该榜单发布以来的最低水平。欧洲从上一期的141台减少到107台,其中德国32台、法国和英国各18台。另一个超算强国日本从上一期的40台降至36台。
4 中国大陆入围109台,比上一期的37台增加了几乎2倍。中科曙光(49台)、联想(25台)和浪潮(15台)共同发力促成中国超算迅速发展。
5 从公司角度看,惠普生产的超级计算机最多,为156台。其次是美国克雷公司,贡献了69台。中科曙光以49台位居第三,联想以25台居第六位,浪潮以15台位居第八。此外,联想去年收购IBM的X86服务器业务,一些原本属于IBM的超算系统现在改标为IBM/联想(9台)或联想/IBM(5台),但这些并不包括在联想上榜的25台超算之内。
6 此次上榜的超级计算机中有80台超算的浮点运算速度超过每秒千万亿次,而上一期为68台。
7 此次上榜的超级计算机中共有445台采用英特尔芯片,占上榜超算总数的89%。而上一期,这一数字为86.2%。采用IBM公司开发的Power处理器的超算系统从上期的38台降至26台。
8 此次上榜的超级计算机中,有98%的超算系统使用的处理器至少有6个核心(即负责执行计算、数据处理等最重要任务的内核),88%的超算系统运用至少含8个核心的处理器,47%的超算系统使用内含10个或更多核心的处理器。
9 上榜的全部超算系统的平均计算能力提升速度从2013年开始放缓,现在已降至每年提升约55%,而1994年至2008年间为90%。
 楼主| 空弹匣 发表于 2015-11-17 08:37 | 显示全部楼层
本帖最后由 空弹匣 于 2015-11-17 08:59 编辑

不同路线的较量:中美新超算哪家强
铁流 科技、金融观察者
发表时间:2015-11-17 07:35:41 http://www.guancha.cn/tieliu/2015_11_17_341535.shtml

11月16日,新一期全球超级计算机500强榜单在美国公布,中国“天河二号”超级计算机连续六度称雄。回想今年4月,美国对中国数家机构禁售至强PHI计算卡。就当很多舆论认为天河超算将遭遇劫难之时,国防科大接连对外发布足以替代E5的“火星”和可以替代至强PHI的矩阵2000,既是向美国禁售至强PHI的亮剑,也是公开了天河超算将来的发展方向——矩阵2000替代至强PHI,实现自主创新,走一条以往没人走过的GPDSP路线。

所谓GPDSP,是通用数字信号处理器,用于高速、实时的信号处理,有非常高的双精浮点性能,国防科大正是将其作为超算的加速器。

笔者日前采访了中国计算机学会高性能计算专业委员会秘书长张云泉,他指出,中国新一代超算在性能上是可以与美国超算匹敌的,但在实际应用水平上还有差距。因为采访机会难得,没有谈许多读者关心的基础知识,这里做些补充,以便读者能理解,相对于美国走GPGPU路线的新超算,即利用GPU很高的双精浮点性能在超算中充当加速器,中国走GPDSP路线到底孰优孰劣。

同构计算和异构计算

不同加速器的选择,导致中美超算的不同发展路线。那么为什么要用到加速器呢?

超算可以分为两种架构。采用同构计算架构的超算只需要单纯使用一种处理器,在同一类型的处理器上执行计算任务。举例来说,日本超算“京”采用的处理器是富士通的Sparc64-VIIIfx,中国的全国产超算神威蓝光采用了申威1600,美国的Mira和Sequoia采用了PowerPC-A2处理器,这些超算都没有采用GPU或其它类型的众核芯片等加速器。日本富士通的京,美国IBM的Mira和Sequoia,中国的神威蓝光都是采用同构计算架构超算的代表。

日本超算“京”

IBM的Sequoia

而异构计算要使用不同类型的处理器来处理不同类型的计算任务。常见的计算单元包括CPU、GPGPU、GPDSP、ASIC、FPGA和其它类型的众核处理器等。异构计算是一种分布式计算,它或是用能同时支持SIMD方式和MIMD方式的单个独立计算机,或是用由高速网络互连的一组独立计算机来完成计算任务。采用异构计算架构的超算会使用至少2种类型的处理器,其中异构计算架构中通用CPU负责逻辑复杂的调度和串行任务,加速器负责并行度高的任务,实现计算加速。具体来说,采用异构计算架构的超算在运算中既使用处理器,又使用GPU或众核芯片等加速器。以美国泰坦和中国天河2号为例,泰坦有18688个运算节点,每个运算节点由1个16核心AMD-Opteron-6274处理器和1个NVIDIA-Tesla-K20加速器组成,共计299008个运算核心;天河2号有16000个计算节点,每个节点由2片Intel-E5-2692和3片Xeon-Phi组成,共使用了32000片Intel-E5-2692和48000片Xeon-Phi。除了泰坦和天河2号之外,曙光6000和天河1号也采用的是异构计算架构。

美国泰坦

异构计算的优势

因超算大多应用于金融、制造、能源、科研和军事等领域,对双精浮点要求较高。采用GPGPU或众核芯片做加速器,一方面可以获得很高的浮点性能,另一方面可以获得不错的性能-功耗比。以天河2号的一个计算节点为例:

Xeon-E5的满载功耗达145W,双精浮点为0.21TFlops,而Xeon-PHI功耗300W,双精浮点达1T Flops;天河2号一个计算节点由2片Xeon-E5和3片Xeon-PHI组成,理论双精浮点性能为3.42T Flops,功耗为1190W,理论双精浮点性能与功耗的比值为2.87GFlops/W。相同功耗下使用8片Xeon-E5只能获得1696Gflops的理论双精浮点性能,理论双精浮点性能与功耗的比值为1.42GFlops/W。从数据可以看出,在同等功耗下,在使用Xeon-PHI加速后,理论双精浮点性能与是只使用Xeon-E5的2倍。

因此,相同功耗的情况下,异构计算能获得非常高的理论双精浮点性能。

诚然,有得必有失,在获得性能优势的同时,也不可避免的会导致编程方面的困难。具体来说,用GPU做加速器的话,会因为GPU和CPU的编程模型不一致,导致在编程上不如采用同构技术(e.g. 纯CPU)的超算方便,在通用性方面也会稍逊一筹。

总之,同构计算编程方便、效率高、通用性强;异构计算编程麻烦、效率不如同构超算、通用性差,但是性能-功耗比高。因此虽然在通用性和效率方面相比采用同构计算的超算处于劣势,但更加好的性能-功耗比成为其更受偏爱的原因。天河2号、天河1号、曙光6000等超算都采用了异构计算架构。

加速器的选择

异构计算非常重要的一点就是加速器的选择,加速器的性能很大程度上会影响到超算的性能。举例来说,Xeon-Phi在运行linpack测试时,实际性能仅仅相当于理论最大运算性能的65-70%,这直接导致了天河2号的整机效率仅为61.7%,同样使用Xeon-PHI的美国超算Stampede的整机效率比天河2号更低,只有60.7%,而且这还是Stampede的运算能力仅为天河2号的五分之一的情况下的成绩——因为超算运算能力越强,效率就越难提升,因此,在被Xeon-Phi的低效率拖累的情况下,以天河2号的性能而言,61.7%的整机效率实属不易。

天河2号

美国超算Stampede

大规模科学计算一般都能做到高度并行化,能将计算任务拆分给海量的小核心来并行执行。因此,在加速器选择方面就产生了三个方案:

一是用GPGPU做加速器。因为GPU是大宽度并行结构(GPU拥有海量SIMD计算单元),高端GPU的资源集成度非常高,能很容易做到非常高的理论双精浮点计算能力。以英伟达最新的加速卡K80为例,该加速卡功耗300W,双精浮点高达2.9TFlops。

二是用众核芯片做加速器。一方面添加浮点、向量指令(比如Intel的AVX、FMA,龙芯的LoongSIMD)提升浮点性能。另一方面堆砌核心数量,比如Intel的第一代Xeon-PHI就有60核,双精浮点性能为1T,功耗为300W;龙芯也曾经有过16核的龙芯3C的方案,但在工作进度完成大半后被迫放弃。因国产众核加速器还处于保密状态,美国情报部门对其非常感兴趣,本文就不将其与英伟达的GPGPU和Intel的Xeon-Phi做对比了,唯一能透露的就是,该众核芯片虽然性能逊色于Intel的Xeon-Phi,但设计理念非常先进,是优于Xeon-Phi的存在。

三是用GPDSP做加速器。国防科大自主研发了矩阵2000以替代Intel的Xeon-PHI,矩阵2000双精浮点达2.4T,功耗200W,虽然离第二代至强PHI双精浮点3T的性能有差距,但性能和性能-功耗比都足以笑傲天河2号正在使用的Intel第一代至强PHI,成为天河2A升级计划中至强PHI计算卡的理想替代品。

GPGPU和GPDSP的优缺点

GPU的大宽度并行结构能做到非常高的理论双精浮点计算能力(英伟达的加速卡K80双精浮点高达2.9TFlops)。但因CPU和GPU的编程模型是不一致,导致GPGPU在编程方面很不方便,只能跑OpenCL、OpenACC、CUDA代码,不能跑OpenMP并行处理的代码。加上GPGPU作为加速卡和CPU是不共享内存,需要程序员显式拷贝,进而导致数据访问速度变慢。因此,GPGPU相对而言编程麻烦、效率相对而言并不高、通用性差,但是性能-功耗比高。

GPDSP是国防科大首创,是应对美国禁售Xeon-PHI的技术储备和秘密武器。国防科大最迟在2013年就开始着手GPDSP的研发工作。今年发布的矩阵2000采用40nm制程工艺,拥有16核,主频1G,双精浮点2.4T,功耗为200W。因此,矩阵2000虽然在性能上因受制于国内的制造工艺和设计水平,在性能上不如GPGPU,但在性能-功耗上已经略优于GPGPU(2.4T/200W 对比 2.91T/300W),而且已经大幅优于天河2号目前使用的第一代至强PHI计算卡(2.4T/200W 对比 1T/300W)。

GPDSP相对于GPGPU更接近于CPU,可以独立运行OS(Linux或其它实时内核),在编程方面比GPGPU稍微容易一些(其实相对于CPU两者编程难度都很大)。矩阵2000也是带分支能力的众核处理器,和Xeon- PHI是相似类型计算卡,理论上讲,扩充一些GPDSP编译指导语句也能跑OpenMP代码。当然,GPDSP也能跑OpenCL、OpenACC并行处理代码(异构代码)。

因此,GPDSP虽然在性能上不如GPGPU,但在性能-功耗上已经略优于GPGPU(2.4T/200W 对比 2.91T/300W),在效率和通用性方面优于GPGPU。

GPGPU相对于GPDSP处于先天劣势

据了解,美国的2台新超算将于2017—2018年被安装在劳伦斯利物莫国家实验室和橡树岭国家实验室,这两台超算将采用IBM和英伟达的产品,理论浮点计算能力都超越100Pflops,将会是天河2A、新一代曙光超算冲击世界第一的强有力竞争对手。

那么,相对于走GPGPU路线的美国新超算Sierra和Summit,国防科大的GPDSP和美国的GPGPU孰优孰劣呢?

GPU在做并行计算时,传统渲染架构中的TMU、 ROP等特性毫无用处,反而占用了晶体管资源。DSP是纯粹向量机,不像GPU那样有光栅化渲染占晶体管,影响管线结构。

虽然GPU是大宽度并行结构,高端GPU的资源集成度非常高,能很容易做到非常高的理论双精浮点计算能力,但在彼此工艺和集成能力相当的情况下,舍弃图形部分的DSP的晶体管效率更高,而且访存效率也高于GPU传统图形渲染管线那种绕弯子的访存方式。

因此,GPDSP在效率方面比GPGPU具有先天优势,很有可能就是借鉴了GPU的Shader执行部分的管理和执行结构,但又没有GPU那么多历史遗留框架造成的负面影响。国防科大在天河1和天河2的研制过程中,在加速器的选择方面把众核处理器和GPU都试了一遍,相信选择GPDSP路线是国防科大深思熟虑后的结果——中国在制造工艺和超大集成度芯片设计能力不如国外英伟达、IBM、Intel等国外巨头的时候,走GPDSP路线是缩短和国外产品在绝对性能上差距的有效途径。

中国超算发展计划

依据曙光公司公布的资料,新一代超级计算机系统——曙光7000将从处理器、高速通信网络、大规模存储系统、系统软件到应用软件全面采用自主技术,安全可控,性能将超越100PFlops。

某超算全面采用自主技术,性能-功耗比、整机效率、理论峰值等性能参数更是无与伦比——超算系统峰值几乎是天河号的2倍;超算系统整机效率比天河2号高16%;超算系统性能-功耗比是天河2号的2.5倍,根据2015年6月发布的Green500排行榜,该超算能直接排进前五。超算建成后,将面向医疗服务、生物医药、海洋科学、现代农业、油气勘探、气候气象、金融分析、信息安全、工业设计、动漫渲染等领域提供计算和技术支持服务,为中国科技创新和经济发展提供平台支撑。

根据国防科大公布的资料,因保留了天河2号的主体I/O结构,计算节点处理器依旧使用E5-2692V2,计算节点增加到18000个,按照一个计算节点需要2个E5和3个加速器来计算,天河2A需要36000片E5和54000片矩阵2000,仅54000片矩阵2000理论浮点峰值可以达到129.6Pflops。

国防科大若要将蓝图变成现实,技术难点已经不再是芯片的设计和制造,而是软件堆栈,包括GPDPS驱动程序、操作系统、编译器、基础库等,这是一项工程量巨大的工作。

祝国防科大、曙光好运!

spacedog 发表于 2015-11-17 09:43 | 显示全部楼层
兔子这是准备把超算做成白菜价吗?今后如果大规模向欧美发达国家倾销,白皮们一定恨得牙痒痒!但是对于兔子来说,反正是两头在外(处理器和客户都在国外,米鼈无法禁运),低价走量冲洗市场,白皮的超算公司很难立足。科技兔在赚取一点辛苦钱的同时可以积累经验、培养人才。也算在高科技商场上“以战养战”吧
fly2014 发表于 2015-11-17 09:53 | 显示全部楼层
兔子在应用方面还是太弱了。把这些超算满负荷应用起来。哈哈
蟀率的珞子 发表于 2015-11-17 10:56 | 显示全部楼层
是的,应用是关键的关键。
不能成为摆设,失去了存在的意义和发展的动力
zhyuli 发表于 2015-11-17 12:23 | 显示全部楼层
蟀率的珞子 发表于 2015-11-17 10:56
是的,应用是关键的关键。
不能成为摆设,失去了存在的意义和发展的动力

参考本人在类似的帖子的回复

http://www.haohanfw.com/forum.php?mod=forumdisplay&fid=42
蟀率的珞子 发表于 2015-11-17 16:02 | 显示全部楼层
本帖最后由 蟀率的珞子 于 2015-11-17 17:30 编辑


呵呵,笑话,为什么看你的回复,你是那路大神?
有什么高论? 说出来能吓到人
不要那么维护自己脆弱的自尊,已经快过去了



回复 支持 0 反对 1

使用道具 举报

 楼主| 空弹匣 发表于 2016-3-2 20:23 | 显示全部楼层
中科大首次实现量子芯片新型编码 量子相干性提高10倍
发表时间:2016-03-02 15:35:23 http://www.guancha.cn/economy/2016_03_02_352705.shtml
“量子芯片”是未来量子计算机的“大脑”。 据新华社3月2日报道,记者从中国科学技术大学获悉,该校郭国平教授研究组近期在量子芯片开发领域取得一项重要进展,他们首次在砷化镓半导体量子芯片中实现了量子相干特性好、操控速度快、可控性强的电控新型编码量子比特。国际学术期刊《物理评论快报》日前发表了该成果。
点击查看大图
郭国平研究组多年来致力于半导体量子芯片的开发,沿着电荷编码量子比特实现超快量子计算路线图,2013年来已经先后实现电荷编码超快普适单量子比特逻辑门和两量子比特控制非逻辑门。但是,相比自旋编码量子比特,电荷量子比特缺少长相干特性,如何继续探索延长电荷编码比特相干时间的新方法,在保证量子比特超快操控速度的同时,获得与自旋编码量子比特同样的长相干特性,是研究组需要解决的一个核心问题。
研究组利用半导体量子点的多电子态轨道的非对称特性,首次在砷化镓半导体系统中实现了轨道杂化的新型量子比特,巧妙地将电荷量子比特超快特性与自旋量子比特的长相干特性融为一体,实现了“鱼”和“熊掌”的兼得。
实验结果表明,该新型量子比特在超快操控速度方面与电荷量子比特类似,而其量子相干性方面,却比一般电荷编码量子比特提高近10倍。同时,该新型多电子轨道杂化实现量子比特编码和调控的方式具有很强的通用性,对探索半导体中极性声子和压电效应对量子相干特性的影响提供了新思路。
yy1129 发表于 2016-6-20 15:23 | 显示全部楼层
本帖最后由 yy1129 于 2016-6-20 15:25 编辑

神威太湖之光”取代“天河二号”成为全球最快超算

       新华社华盛顿6月20日电(记者林小春)新一期全球超级计算机500强榜单20日公布,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首,中国超算上榜总数量也有史以来首次超过美国名列第一
  据国际TOP500组织当天发布的榜单,“神威太湖之光”的浮点运算速度为每秒9.3亿亿次,不仅速度比第二名“天河二号”快出近两倍,其效率也提高3倍。更重要的是,与“天河二号”使用英特尔芯片不一样,“神威太湖之光”使用的是中国自主知识产权的芯片
  该组织在一份声明中写道:“中国在国际TOP500组织第47期榜单上保持第一名的位置,凭借的是一个完全基于中国设计、制造处理器而打造的新系统。”
  “神威太湖之光”由国家并行计算机工程技术研究中心研制,安装在国家超级计算无锡中心。此前,由中国国防科技大学研制的“天河二号”超级计算机已在TOP500榜单上连续六度称雄。
  榜单前十名除了“神威太湖之光”与“天河二号”外,其他分别是美国的“泰坦”与“红杉”、日本的“京”、美国的“米拉”和“三一”、瑞士的“代恩特峰”、德国的“花尾榛鸡”和沙特阿拉伯的“沙欣II”。
  TOP500榜单是对全球已安装的超级计算机“排座次”的权威排行榜。从1993年起,由TOP500国际组织以实测计算速度为基准每半年发布一次。
  此次榜单还有一个重大变动是,美国入围的超级计算机总数量首次跌下第一位置。上述声明说,由于过去一些年中国工业和研究部门注册提交的系统数量剧增,中国现在入榜的超级计算机数量达到167台,超过美国的165台。此外,由于中国占据TOP榜单头两名,中国在计算性能类别上也居于领先位置。
  排行榜主要编撰人、美国田纳西大学计算机学教授杰克·唐加拉评价道,中国超级计算机不断增多已成为一个“趋势”。
  “2001年中国上榜数量还是零,但今天中国已经超过美国,”唐加拉对新华社记者说,“没有其他国家有这样快的增长速度。”
  唐加拉认为,超级计算机“比以往任何时候都重要”,能为能源、医药、飞机制造、汽车与娱乐业等广泛领域的行业提供高性能计算服务。“更强大的计算能力将使得这些不同行业更快地生产出优异新产品,从而提高一个国家的竞争力”。
fly2014 发表于 2016-6-20 15:29 | 显示全部楼层
老美不是要限制CPU出口吗?中国超算还是一样NB
fly2014 发表于 2016-6-20 15:30 | 显示全部楼层
这个应该是无锡xx所研制的吧?
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

QQ|申请友链|旗下论坛|小黑屋|手机版|航空航天港 ( 豫ICP备12024513号 )

GMT+8, 2017-7-21 12:42 , Processed in 0.398896 second(s), 21 queries , Gzip On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表