航空航天港

 找回密码
 注册会员

QQ登录

只需一步,快速开始

楼主: 空弹匣
收起左侧

[电子信息技术] 国产超级计算机专题

[复制链接]
fly2014 发表于 2016-6-20 15:34 | 显示全部楼层
国家并行计算机工程技术研究中心 依托:中国科学院计算技术研究所,江南计算技术研究所。
yy1129 发表于 2016-6-20 15:38 | 显示全部楼层
本帖最后由 yy1129 于 2016-6-20 15:44 编辑
fly2014 发表于 2016-6-20 15:30
这个应该是无锡xx所研制的吧?

国家并行计算机工程技术研究中心经家科委批准于1992年8月开始组建,1996年6月通过国家验收。中心总部设在北京市高新技术产业开发试验区内,中心主任为国内知名计算机专家、中国工程院院士金怡濂教授。

依托:中国科学院计算技术研究所,江南计算技术研究所

成果:
2012年09月11日上午,由我中心研制的我国第一台全部采用国产CPU和国产基础软件构造的千万亿次超级计算机系统——“神威蓝光千万亿次高效能计算机系统研制”在济南通过专家验收。
       具备四大亮点:

一 是全部采用国产CPU,是我国历史上首台全部采用国产CPU的千万亿次超级计算机

二是稳定性较好,测试Linpack 全过程9个多小时无故障;

三是完善的水冷系统——通过水在冷板内部的封闭水循环带走主板热量,几乎不损耗水且无噪音,先进环保;

四是高密度封装,一个机仓 可装入1024个CPU,千万亿次规模仅需要9个这样的机仓就可以轻松实现。


yy1129 发表于 2016-6-20 16:04 | 显示全部楼层
本帖最后由 yy1129 于 2016-6-20 16:16 编辑

“神威太湖之光”取代“天河二号”成为全球最快超算
新华社照片,无锡(江苏),2016年6月20日
    “神威太湖之光”取代“天河二号”成为全球最快超算

        这是“神威太湖之光”超级计算机(6月20日摄)。

        这是“神威太湖之光”超级计算机的监控面板(6月20日摄)。

      一名研发工程师展示“神威太湖之光”所使用的“申威26010”众核处理器(6月16日摄)。该处理器采用64位自主申威指令系统,峰值性能3.168万亿次每秒,核心工作频率1.5GHz。“神威太湖之光”里安装有40960个这样的处理器

      这是“神威太湖之光”超级计算机的交换机网线(6月16日摄)。“神威太湖之光”采用大规模高流量复合网络体系结构,实现全系统高带宽、低延迟通信。

        6月20日,新一期全球超级计算机500强榜单公布,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首,中国超算上榜总数量也有史以来首次超过美国名列第一。
       据国际TOP500组织当天发布的榜单,“神威太湖之光”的浮点运算速度为每秒9.3亿亿次,不仅速度比第二名“天河二号”快出近两倍,其效率也提高3倍。更重要的是,与“天河二号”使用英特尔芯片不一样,“神威太湖之光”使用的是中国自主知识产权的芯片。
       “神威太湖之光”由国家并行计算机工程技术研究中心研制,安装在国家超级计算无锡中心。此前,由中国国防科技大学研制的“天河二号”超级计算机已在TOP500榜单上连续六度称雄。
    新华社记者李响摄

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册会员

x
yy1129 发表于 2016-6-20 16:32 | 显示全部楼层
焦点科普:超算排行问与答
  新华社华盛顿6月20日电国际TOP500组织20日公布全球超级计算机500强排行榜最新榜单,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首;同时中国超算上榜总数有史以来首次超过美国,名列第一。
  全球超级计算机500强榜单怎样产生?“神威太湖之光”有何“神威”?今年榜单反映出超算发展的哪些新趋势?以下是记者根据最新榜单整理的信息。
  问:登上榜首的“神威太湖之光”计算速度有多快?
  答:“神威太湖之光”的浮点运算速度为每秒9.3亿亿次,速度比此前六连冠、目前排第二的“天河二号”快出近两倍,效率也提高3倍。
  问:“神威太湖之光”有何突破之处?
  答:“神威太湖之光”是首次完全用“中国芯”制造的中国最强大的超级计算机,此前“天河二号”使用的是英特尔至强(Xeon)处理器和Xeon Phi协处理器。随着中国“天河二号”在超算排行榜上连续夺冠,去年年初,美国政府禁止其企业向中国出口与超级计算机相关的技术。但专家指出,有关限制措施不但对美国公司不利,反而使中国加速发展自己的芯片技术
  问:中国超级计算机发展处于什么水平?
  答:数据显示,我国在超算领域已走在世界前列。从上榜总数看,中国从上一期的109台猛增至现在的167台,成为全球名列第一的高性能计算机用户;而美国从上一期的199台下降至165台,有史以来首次无缘总数第一。从公司角度看,美国惠普生产的超级计算机依然最多,为127台;其次是中国联想,从上一期的25台大幅上升至84台;位列第三至第五的分别是美国克雷、中科曙光以及中国浪潮公司。但在芯片研发领域,美国仍有较大优势。上榜超算中,有455台使用英特尔芯片,使用IBM和超威半导体公司(AMD)芯片的分别为23台和13台。
  问:全球超算计算速度发展呈现哪些趋势?
  答:此次榜单中,有95台超算的浮点运算速度超过每秒千万亿次,比上一期多出十余台。此次榜单最后一名的运算速度为每秒285.9万亿次,而上一期最后一名为每秒206.3万亿次;此次最后一名在上一期排第351名,这意味着榜单最后一名的计算性能提升幅度在经历最低潮后有小幅回升。本次全部500强的运算速度总和为每秒566.7千万亿次,半年前为每秒420千万亿次,去年6月为每秒363千万亿次。而从大的时间跨度来看,近几年超算整体性能的提升速度呈“显著减缓”趋势。
  问:超级计算机一般应用在什么领域?
  答:超算是国家科研的重要基础工具,应用领域覆盖政府、能源、安全等国家命脉行业以及互联网、数据中心等科技前沿领域。以安装在国家超级计算广州中心的“天河二号”为例,其应用领域包括生命科学、材料科学、大气科学、地球物理、能源、宇宙、经济学等,在大型基因组组装、基因测序、生物医学、高通量药物筛选、污染治理、高超声速发动机燃烧模拟等学科和工程项目也有广泛应用。此外,在智慧城市、电子政务、云计算和信息服务等方面也获得了成功应用。
  问:全球超级计算机500强榜单是怎样产生的?
  答:全球超算500强榜单是对全球已安装的超级计算机“排座次”的权威排行榜。从1993年起,由TOP500国际组织以计算机实测速度为基准,每半年发布一次。
rhZhao 发表于 2016-6-20 20:10 | 显示全部楼层
这台计算机的CPU如果按照全世界最先进的工艺打造估计还能省电30%左右,或者是可以在同样面积的芯片上设计出更密集的集体管线路与阵列,但是图中工作人员只给你看了芯片背面的针脚,没有给你看正面。但从数据上来看,它的功耗/计算比已经非常厉害了。不知道它的协处理器是什么规格的。
lemoncap 发表于 2016-6-20 20:59 | 显示全部楼层
申威26010 的流片单位,工艺? 这个该是非常有意义的。
lemoncap 发表于 2016-6-20 21:01 | 显示全部楼层
近4000管脚的BGA
zhyuli 发表于 2016-6-20 22:33 来自航空航天港手机版! | 显示全部楼层
md还没到无路可走的地步,继续努力吧
zhyuli 发表于 2016-6-21 09:09 来自航空航天港手机版! | 显示全部楼层
关于软件和硬件的关系,我理解是这样的,硬件不行,软件的主要使命就是最大限度绕开硬件的缺陷,并充分利用硬件资源。硬件牛逼,软件的主要使命就是利用硬件资源发挥更好的功能~前者是工程技术问题,后者是应用技术问题,硬件如果不是瓶颈,软件一定有更有创造性
pingkefu 发表于 2016-6-21 12:42 来自航空航天港手机版! | 显示全部楼层
lemoncap 发表于 2016-6-20 20:59
申威26010 的流片单位,工艺? 这个该是非常有意义的。

应该是中芯国际的28nm技术。HPC真是被intel养得不思进取了,只在CPUGPU上下手,还有就是CPUPhi计算卡。而真正有突破性的技术总感觉在京、神威这样的奇招上
fly2014 发表于 2016-6-21 13:19 | 显示全部楼层
28nm工艺已经很成熟了。
 楼主| 空弹匣 发表于 2016-6-21 18:12 | 显示全部楼层
铁流:最新超算第一名“神威太湖之光”到底有多强?
铁流 发表时间:2016-06-21 11:10:10 http://www.guancha.cn/tieliu/2016_06_21_364813.shtml
据新华社6月20日消息,新一期全球超级计算机500强榜单20日公布,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首,中国超算上榜总数首次超过美国,名列第一(中国有167台HPC入围TOP500,美国是165台)。
自“天河二号”荣登TOP500榜首并6度蝉联桂冠以来,一直有社会舆论攻击“天河二号”使用美国Intel的CPU,因而不具备技术含量,甚至有媒体引用所谓业内人士声称“只要把足够多的手机芯片连接起来,性能轻松超越天河二号”,一言蔽之,就是“天河二号”是组装货,中国并不掌握超算核心技术。
这种论调正确与否暂且不论,本次“神威太湖之光”采用了全自主技术则是对上述舆论的有力回击,不仅实现了在超算领域彻底扭转在技术和信息安全上受制于人的局面,还使美国对中国四家超算中心禁售Intel至强PHI计算卡成为笑柄,再次在信息技术领域实现了“凡是买不到的,中国人自己都能做出来”。

一台超算由什么组成

先来分析此前的一种论调:超算的全部技术都在CPU吗?
超算系统可以分为软件系统和硬件系统两部分。
超级计算机硬件系统主要由高速运算系统、高速互连通信网络系统、存储系统、维护监控系统、电源系统、冷却系统和结构组装设计等部分组成。具体来说:
高速运算系统负责逻辑复杂的调度和串行任务和并行度高的任务,可以是采用同构计算(纯CPU组成计算节点),也可以采用异构计算(CPU+加速器组成计算节点);
高速互连通信网络由infiniband、高速以太网、自定制互联机制构成,将所有计算节点连接起来,使其成为一个整体;
存储系统由内存和外存组成,负责数据交换和储存;
维护监控系统保障超算不死机、不出错,毕竟每隔几秒出一次错,死一次机,这种足以让超算的使用者精神崩溃;
电源系统包装能源供应;
冷却系统帮助超算降温,防止出现超算过热而造成的不良后果;
结构组装设计是将上述系统装载到一起,在保障性能和稳定性的基础上,实现机柜体积最小。

运算系统机舱内部

超级计算机软件系统主要包括操作系统、编译系统、并行程序开发环境、科学计算可视化系统等四个重要组成部分。具体来说:
操作系统系统主要包括对同构技术或异构协同支持,高效能支撑扩张,基础服务内核,全局并行文件系统;
编译系统的功能是支持C、C++、Fortran77/90/95等编程语言,支持OpenCL、OpenMP、MPI等并行编程语言,支持编译优化;
并行程序开发环境的功能是提供程序接口,支持应用程序的调试和性能分析;
科学计算可视化系统由海量数据服务模块、并行绘制与显示模块和可视化映射与操作模块组成。
因此,运算系统、存储系统、互联系统、操作系统、基础库、应用软件,以及监系统控、冷却系统、电源系统等都是超算的重要组成部分。因此,一些人称因国产超算使用美国Intel的CPU,因而不具备技术含量,将CPU等同于超算的全部技术的说法显然是非常不科学的。
超算不是简单堆砌CPU
有媒体引用所谓业内人士声称,“把足够多的手机芯片连起来就能超越天河2号。”但实际上,这个说法也是值得商榷的。
因为堆CPU也是一个技术活,体系结构设计的不好,高速互联网络做的不行,系统软件做的不好,储存列阵做的不行,即使堆再多的CPU,超算的性能也上不去。简单粗暴的堆砌CPU根本不可能制造出一台超级计算机,更不要说是能与天河2号相匹敌的超算。
另外,哪怕掌握了正确的堆砌CPU的方法,也不是单凭靠堆CPU数量就能获得一台能与天河2号相匹敌的超算。原因何在? 因为超算建设不是简单的搭积木式的堆砌CPU——即便堆砌了海量的计算卡,但受制于其他方面,比如高速互联网的技术水平,也会导致无法到达理论计算性能。
具体来说,高速互联网络的难点在于超算的计算节点之间传输的数据量巨大,延迟要求严格,当互联网络效率不足,就会导致数据拥堵,大幅降低超算整机系统效率。而超算的计算节点越多,对互联网络的要求也就越高。因此,即使想通过堆砌CPU来提升运算能力,也会受限制互联网络的性能,造成这种做法并不能无节制的提升超算的性能——受制于诸如互联网络以及其他方面的瓶颈,整机效率被拉低,导致实际性能并没有因为堆砌了更多的CPU而有所提高。
另外,堆砌过多的CPU还存在功耗过大、机箱体积过大等问题,非常不利于日后的运营维护和使用,在超算市场基本不具备市场竞争力。正是因为高速互联网络的重要性,相对于在2015年才对中国四家超算中心禁售Intel计算卡,高速互联网络却早就被美国列入技术封锁的名单。
在软件系统方面,控制少量计算节点和控制大量计算节点对软件系统的要求近乎于天差地别。软件系统必须保证每个超算计算节点的性能被发挥到最大才能充分挖掘出硬件上的潜力,否则,就会影响超算的整机效率。
另外,TOP500头几名的计算节点大多在数千近万,甚至一万个以上,某几个计算节点损坏,并需要更新是常有的事。当计算节点损坏时,软件系统必须做到部分节点损坏时不会发生死机、报错等情况,不影响计算任务的持续。
因此,如果没有一个好的体系结构,那么CPU的性能将无法全部发挥出来,而且堆砌的CPU数量越多,整个系统就越复杂,对高速互联网络、存储列阵、监控系统、冷却系统和软件方面的要求也就越高,整机效率的提升也就越难。而体系结构设计能力水平不够高的情况下,单纯堆砌CPU数量,反而会降低整机效率,无法提升整机性能。
“神威太湖之光”牛在哪里

TOP10新排名

“神威太湖之光”刷新TOP500排行榜,依靠的是其强悍的双精浮点性能——其高达125PFlops双精浮点峰值和93PFlops稳定性能让世人惊叹。其实,除了拥有举世无双的双精浮点性能之外,“神威太湖之光”还拥有整机效率高,整机功耗低、性能功耗比高,整机体积小等一系列优点。
 楼主| 空弹匣 发表于 2016-6-21 18:14 | 显示全部楼层
“神威太湖之光”超算拥有40960个计算节点,使用了上海高性能集成电路设计中心设计的国产众核芯片申威26010,采用28nm制程工艺,主频1.45G,拥有260个核心,双精浮点峰值高达3.06TFlops,在双精浮点上完全追平了Intel最好的超算芯片。正是得益于国产众核芯片申威26010的强悍性能,加上良好的体系结构设计以及互联网络等核心部件,使超算拥有异乎寻常的高性能、高效率、低功耗、高性能功耗比和小体积:
高性能——神威太湖之光双精浮点峰值高达125PFlops,稳定性能为93PFlops,相比较之下,美国超算泰坦的双精浮点峰值高达27 Pflops,稳定性能为17.6 PFlops,天河2号的双精浮点峰值高达54.9Pflops,稳定性能为30.65PFlops,由此可见,“神威太湖之光”在稳定性能是美国超算泰坦的5.2倍(泰坦很可能是美国现在顶尖的超算之一,完成升级的Stampede 2性能为18PFlops)。
高效率——“神威太湖之光”整机效率高达74.16%,相比较之下,美国超算泰坦的整机效率为65.19% ,而河2号的整机效率为55.83%,由于超算性能越强,规模越大,整机效率提升就越困难,“神威太湖之光”在稳定性能是美国超算泰坦5.2倍的情况下,整机效率依然大幅优于泰坦,整机效率之高简直令人惊骇!
低功耗——“神威太湖之光”的功耗为15.3 MW,美国超算泰坦功耗为9MW,天河2号为17.8 MW,可以说,“神威太湖之光”的稳定性能达到天河2号3倍的水平,但整机功耗却低于天河2号。
性能功耗比高——“神威太湖之光”的性能功耗比高达6G/W,相比之下,TOP500超算榜单上的竞争对手都相形见绌——天河2号的整机性能功耗比为1.95G/W,美国泰坦超算的性能功耗比为2.143G/W,美国超算红杉整机性能功耗比为2.069G/W,日本超算“京”整机性能功耗比为0.830/W,美国超算Mira 整机性能功耗比为2.069G/W(Mira和红杉用的都是IBM的Power)……即便是全球Green500排行榜,“神威太湖之光”也能排至第三位。由于Green500排行榜第一和第二的超算只采用了低功耗版的Intel E5,性能非常弱,而即便是采用英伟达K80加速卡的超算,其整机性能功耗比也只有4.7G/W。因此,“神威太湖之光”在性能功耗比上显得格外耀眼。
小体积——“神威太湖之光”机柜占地605平方米,美国超算泰坦机柜占地面积404平方米,天河2号机柜占地面积720平方米。

曾经刷榜的中国超算

中国有三大超算系列:天河、神威、曙光。三大系列超算分别由国防科大、曙光公司,以及地处江南的某研究所研制,当然,其中也不乏互相协作以及其他单位参与的情况。近年来,中国超算频频刷榜,不仅赚足了眼球,还为中国国防军工以及社会经济发展产生了促进作用。
2009年,中国第一台国产千万亿次超级计算机天河一号在湖南长沙亮相。天河一号超级计算机由国防科大研制,性能为每秒1206万亿次的峰值速度,Linpack实测性能为每秒563.1万亿次,强劲的性能使天河一号位列中国超级计算机前100强之首。2010年,国防科大对天河1号进行了升级,使天河1A的实测运算能力从天河1号的每秒563.1万亿次,提升至2507万亿次,成为当时世界上最快的超级计算机。虽然天河1A使用的是国外芯片——14336片Intel Xeon X5670六核处理器,7168片NVIDIA Tesla M2050高性能计算卡,但国防科大在互联网络等方面的技术底蕴颇为不俗。另外,天河1A采用了2048片飞腾 1000 八核心处理器。
2010年,曙光6000以实测每秒达1271万亿次的Linpack峰值速度,在2010年第35届全球超级计算机500强排名中名列第二。曙光6000由曙光公司研制,和天河1号一样,曙光6000同样是以国外芯片为主,以国产芯片(龙芯)为辅。
2012年,神威蓝光超级计算机投入使用。虽然该超算并未冲击TOP500前3名,但作为“神威太湖之光”的上一代产品,神威蓝光超算还是值得一书的。神威蓝光超算使用了8704片申威1600,搭载神威睿思操作系统,虽然超算绝对性能并不高,但却是中国在“市场换技术”之后,首次实现了超算CPU和操作系统的全部国产化。神威蓝光超算峰值计算性能为每秒一千万亿次,持续性能为每秒796万亿次,性能功耗比超过741MFlops/W(百万次浮点运算/秒·瓦),LINPACK效率为74%。神威蓝光超算有两大特点,一是全部使用申威1600芯片,搭载神威睿思操作系统,实现操作系统和CPU全部国产化。二是性能功耗比高。神威蓝光超算性能功耗比超过741MFlops/W。该超算被安装在“国家超级计算济南中心”,主要面向气象气候、海洋环境、生物医药、信息安全、航空航天、材料物理、金融分析、工业设计、石油物探等应用领域。
2013年,国防科大成功研制出天河2号,其高达55PFlops的性能使其傲视群雄,六度蝉联TOP500排行榜首位。虽然在计算节点上使用的是美国Intel的CPU,但天河2号也使用了4096片飞腾1500,用于高速互联网络系统。
结语
虽然“神威太湖之光”在整机性能、整机功耗、整机效率、性能功耗比等重要参数上无与伦比,但也并非尽善尽美,它也有自己的阿克琉斯之踵——其内存只有1.31 PB(天河2号为1.4PB)。另外,由于国产众核芯片内存带宽仅有136.51G,而且用的还是DDR3,相比之下,Intel的KNL和英伟达的Tesla都采用3D堆叠内存,内存带宽更是达到512G(Intel PHI) 和 720G(英伟达 Tesla)。因为单个CPU的内存带宽不大,所以对于现实生活中的应用,很难跑出接近峰值的性能。对于某些对内存带宽要求高的应用,实际使用中就不如Tesla和PHI了。
不过,这并非申威26010和“神威太湖之光”的硬伤,得益于申威26010异乎寻常的设计理念,使申威26010单芯片能够完成Intel E5+PHI,或Power+Tesla两款产品的功能,而且相对于Intel E5+PHI,或Power+Tesla,申威26010能够实现共享内存,这就避免了Intel E5+PHI,或Power+Tesla必须面对的显式拷贝,从而降低了对内存的压力,并减小了性能损失。笔者猜测,正是因为申威26010异常先进的设计理念,一定程度上弥补了内存上的不足,使中国科研人员敢于采用136.51G的内存方案。
虽然有内存上的瑕疵,但瑕不掩瑜——在美国的100P超算问世之前(估计要2018年前后),“神威太湖之光”会是全球性能最好的超算。
(作者微信公众号:tieliu1988)
zmic 发表于 2016-6-21 21:22 来自航空航天港手机版! | 显示全部楼层
lemoncap 发表于 2016-6-20 20:59
申威26010 的流片单位,工艺? 这个该是非常有意义的。

这个芯片网上的信息少得可怜。只能知道第一代申威源自Alpha21264,之后发展出自主架构和指令。
rhZhao 发表于 2016-6-21 22:10 | 显示全部楼层
zmic 发表于 2016-6-21 21:22
这个芯片网上的信息少得可怜。只能知道第一代申威源自Alpha21264,之后发展出自主架构和指令。

是的 是基于当年的DEC Alpha 不过之后完完全全重写了指令集合部分构架。
zmic 发表于 2016-6-21 22:21 | 显示全部楼层
rhZhao 发表于 2016-6-21 22:10
是的 是基于当年的DEC Alpha 不过之后完完全全重写了指令集合部分构架。

  这个是当年购买了21264的IP和指令的吧?原来的指令集应该是有保留的,后来扩展了自己的指令,架构后来是全新的吧,包括芯片和新的指令集?
lemoncap 发表于 2016-6-22 11:52 | 显示全部楼层
pingkefu 发表于 2016-6-21 12:42
应该是中芯国际的28nm技术。HPC真是被intel养得不思进取了,只在CPUGPU上下手,还有就是CPUPhi计算卡。而 ...

海量芯,也不是新东西,难得是神威(也含京?)这样的搞出来。不过 海量芯可能搞容易细粒化的计算好搞,但很多不好细粒化的MPP也不见得能提高多少。
pingkefu 发表于 2016-6-22 14:22 | 显示全部楼层
lemoncap 发表于 2016-6-22 11:52
海量芯,也不是新东西,难得是神威(也含京?)这样的搞出来。不过 海量芯可能搞容易细粒化的计算好搞, ...

是的,优化是个大问题。真正让人高兴的地方也不是第一第二什么的,看看研制单位就知道主要还是怕卡脖子
yy1129 发表于 2016-6-23 21:13 | 显示全部楼层
信息安全的国产化市场会越来越大
陈左宁院士解密“神威·太湖之光”超级计算机

        新一期全球超级计算机500强榜单6月20日在德国公布,完全基于中国设计、制造的“神威·太湖之光”取代“天河二号”登上榜首,成为“新科”世界最快计算机。

       而这距离2015年4月,美国宣布对我国四家单位实施高性能计算芯片禁运,仅仅1年零2个月

       “核心技术是买不来的。”中国工程院副院长、中国工程院院士陈左宁6月23日接受《中国科学报》专访时说,“中国自主芯片首次成为全球最快超级计算机‘神威·太湖之光’的心脏,成功地打破了美国的封锁,证明中国人完全有能力用自己的处理器构建世界最高性能的超级计算机。”

《中国科学报》:我国具有自主知识产权的申威26010问世,其峰值速度和能效比达到国际领先水平。具体来说,这颗“中国芯”有哪些优势?

        陈左宁:申威26010在众核处理器体系结构方面有重大原始创新,引领了高性能处理器发展潮流。申威众核处理器采用片上融合异构众核架构,现在以GPU、MIC搭建的超级计算机系统,众核处理器需要联合多核处理器工作,带来了额外的功耗和通信开销,使用也更为复杂。对比美、日等国的E级计算机研发计划,国外同行未来将采用的处理器技术路线与我们的思路非常接近,但到2018年左右才能走到真正的异构融合架构

       此外,申威26010采用全自主指令系统。指令系统是处理器与系统软件之间的桥梁,是处理器研发最核心的基础。国外经过几十年发展和积累,在处理器指令系统方面已形成严密的知识产权保护,国产处理器研发只有打破国外知识产权的壁垒,开发自主的指令系统。基于申威指令系统开发的神威睿智编译器及其工具链,形成了完备的国产自主指令系统技术体系,有效支撑了国产处理器可持续发展的自主可控和安全可靠

       作为国际首款万亿次异构众核处理器,单芯片集成260个核心,峰值性能和能效比等主要指标国际领先,标志着我国自主设计的处理器在高性能计算领域取得重大突破

《中国科学报》:“神威·太湖之光”的配套操作系统是自主研发的神威睿思操作系统。该操作系统有何优势?

        陈左宁:神威睿思操作系统是基于Linux开源代码开发,已有10多年历史,主要面向高性能领域和通用计算领域。

        在高性能领域,神威睿思操作系统级突破了超级计算机千万级处理器核心的可扩展管理和并行运行控制,犹如操作系统指挥千军万马协同作战,实现了异构众核的高效、统一管理。系统具有很强的系统级容错功能,可以支持处理器核心级、核组级和芯片级的容错,实现了神威太湖之光超级计算机软硬件系统的高效可扩展、稳定、可靠运行。

        在通用计算领域,神威睿思操作系统的主要优势在于自主可控度高和安全性强等方面。我们对Linux系统内核进行了全面的剖析,进行了安全性增强和特殊改造,结合申威处理器自主指令系统特点和国产处理器新增安全特性,极大提升了基础硬件平台和核心软件系统的安全性。

《中国科学报》:“神威·太湖之光”目前有哪些应用?未来又有怎样的发展前景?

        陈左宁:“神威·太湖之光”投入使用以来,先后完成了清华大学、北京大学、中科院等30多家单位50多项课题的大规模计算,涉及天气气候、航空航天、船舶工程、海洋环境、石油物探、生物信息、药物设计、电磁仿真、动漫渲染、核物理、新能源、新材料等十多个重要领域,实现了数百万核的超大规模并行,其成果对国计民生、科技进步都将产生重大影响。

       基于“神威·太湖之光”的3项应用,已入围国际高性能计算应用领域最高奖——戈登贝尔奖提名,分别涉及大气、海洋和材料领域。这不仅是中国团队首次入围,更是占据了全部入围数量的半壁江山,打破了西方发达国家的垄断,证明“神威·太湖之光”非常适合挑战性应用,同时也说明中国不仅能够造好的计算机,也能用好计算机,在应用方面达到了国际先进水平。

       支持运行应用的结果表明,“神威·太湖之光”超级计算机运行稳定,高效可靠。

       未来的重点将围绕基于“神威·太湖之光”的应用开发,比如:瞄准世界前沿科学研究和国家战略需求,提供超级计算支撑服务;针对行业重大应用需求和企业重大目标进行产品开发,提供应用计算服务;依托“神威·太湖之光”超强的计算能力,建立产业创新中心,研发并行软件,支持苏南制造,实现江苏省制造业的快速升级转型。

《中国科学报》:将来,“神威·太湖之光”的芯片和操作系统有哪些市场应用的可能性?

       陈左宁:申威众核处理器设计的集群和服务器,已应用于航空航天、天气气象、生物信息、材料科学、船舶工程、计算化学等十多个领域并取得良好的效果。

       从当前业界发展来看,众核处理器已经在超级计算领域占据了权重的位置,并成为未来构建E级计算的主要技术途径,其应用平台尚处于推进阶段。随着申威26010众核处理器的软硬件生态系统不断成熟,更加多样化的平台会满足不同类型用户的需求,培养更加宏大的客户群体,必将在国家众多核心行业的创新发展中发挥显性的作用。

       神威睿思操作系统主要应用于高性能计算与安全两个领域。产品含括超级计算机和各种集群计算机系统;桌面、服务器类通用操作系统,以及网络安全防护、主机安全防护、数据安全防护、安全管理等网络安全类的定制操作系统。目前多个应用领域的推广初见成效。

       随着国家对信息安全的高度重视和国产处理器性能的不断提升,信息安全的国产化市场会越来越大。神威睿思操作系统将重点瞄准自主可控等高安全领域,建立产业联盟,打造国产自主操作系统产业链,为国家信息安全提供保障。
http://news.sciencenet.cn/htmlnews/2016/6/349405.shtm

yy1129 发表于 2016-6-23 21:36 | 显示全部楼层
本帖最后由 yy1129 于 2016-6-23 21:40 编辑

神威太湖之光成最快超算 不只是打脸美国禁运

        6月20日,新一期全球超级计算机500强榜单公布,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首,中国超算上榜总数量也有史以来首次超过美国名列第一。
       据国际TOP500组织当天发布的榜单,“神威太湖之光”的浮点运算速度为每秒9.3亿亿次,不仅速度比第二名“天河二号”快出近两倍,其效率也提高3倍。
       更重要的是,与“天河二号”使用英特尔芯片不一样,“神威太湖之光”使用的是中国自主知识产权的芯片。 “神威太湖之光”由国家并行计算机工程技术研究中心研制,安装在国家超级计算无锡中心。
      此前,由中国国防科技大学研制的“天河二号”超级计算机已在TOP500榜单上连续六度称雄,但是在2015年遭到美国禁售的干扰。
      如今短短一年之后,中国自研的超级计算机就取得了计算能力第一的位置,令人欢欣鼓舞。
     虽然,笔者早在一年前禁售的时候,就写文章提过中国超级计算机行业的后手神威,但是短短一年就造出来大新闻还是挺出乎意料之外的。
     这个神威太湖之光是怎么冒出来的?它是怎么做到世界第一的呢?这得从头说起。

一、超级计算机的发展

       计算机最早就是满足人类高性能计算要求的,无论是第一台机械计算机(英国巴贝奇爵士设计,未最终完成),还是第一台电子计算机Eniac,都是做科学计算和军事用途用的。
       当进入电子计算机时代之后吗,计算机性能的扩展有两条道路,一条的不断改进制造工艺,提升芯片设计水平,把单个芯片设计的很强悍,提升性能。还有一条道路是尽可能用比较多的机器并行,用多机机器一起运算来提升性能。
       早期,超级计算机都是昂贵的高级货,处理器是专门设计的,芯片组是配套的,甚至每根连接线都是定制的,成本极高。
       而随着PC和网络的发展,人们发现追求强大的计算能力可以不那么昂贵。于是,人们开始尝试用大批量生产的PC或者工作站来攒超级计算机。
       若干台PC或者工作站通过网络连接起来,把任务分给这些机器并行,然后返回,计算能力丝毫不弱于昂贵的专用超级计算机,于是传统的超级计算机开始没落。
       这个时代出现了很多平民化的超级计算机,一个美国学校把MAC电脑凑成超级计算机,看似玩具的东西居然一度占据了TOP500超级计算机排行榜,甚至谷歌自己用的服务器也是用这种办法攒出来的。
       而攒机有极限,人们发现,限制超级计算机能力居然是功耗,人们不能堆积太多的数量是因为功率和发热限制,于是,IBM开发出蓝色基因,不追求单个核心的高性能。
      之后就是异构浪潮了,索尼为了提升PS3游戏机的性能,联合IBM搞了Cell处理器,这是异构计算的开始。因为在计算任务中,有些任务是简单的,不需要复杂的逻辑处理,只需要足够的计算单元暴力计算,这样处理器就可以设计成两部分,一个简单的运算核心,几个强大的简单计算单元,这就是Cell的思路。
       而后来人们发现,这种简单暴力计算GPU最擅长,于是就有了GPU通用计算。
       中国在2009年搞出来天河一号超级计算机,就是就是CPU和GPU异构组成的超级计算机,一度排名世界第一。百度搞人工智能的计算机也是这种异构的超级计算机。
       Intel也发展出“众核架构”(MIC)的Xeon Phi协处理器。并且获得了天河2号的选用。成为目前超级计算机的主流配置。

二、神威太湖之光是从哪来的?

       在神威太湖之光上新闻之前,大多数人都对其一无所知。不是这个项目历史短,而是它太低调了。
       关于国产CPU,大家熟知的是龙芯,骗经费的汉芯,而国产CPU里面真正的高端其实是江南所的神威系列
       因为神威是军方项目,所以各项信息没有非常公开,其来源只有一个不太确定的传说
       话说70年代,在Intel横行天下之前,业界的明星是一家名叫DEC的公司,这家公司研发出小型机,把计算机普及到普通的商业机构,成为一代明星。
       而当PC出现之后,这家公司开始研发高端产品,这就是Alpha系列处理器,当年IBM,惠普,SGI,SUN都研发自家的处理器,而Alpha算其中的佼佼者。
       Alpha系列处理器经过几代发展,有非常好的性能和大量前瞻性的设计。无奈商用运作失败,最终DEC被COMPAQ收购,而COMPAQ后来又与HP合并,Alpha系列也就被搁置起来。
       就在此时,处理器方面极其落后的中国在国家还不富裕的情况下重金买下了Alpha的全套技术,准备开发国产的高性能处理器。当时的国家主席江泽民亲自题词“神威”。这就是神威的由来
       当年Alpha堪称处理器的黑科技大全,它的EV6总线被AMD采用,开发出超过Intel的K7,这是AMD历史上唯一一段性能领先Intel的时期。
       Intel也没有落后,Intel随即开发出超线程技术(至今仍然在用),而超线程技术也是Alpha先搞起来的。
       Alpha的21364甚至看到了未来众核的趋势,预留了方案。要知道,Intel搞众核已经差不多是Alpha消失后10年的事情了。
       Alpha被中国买下之后,消化吸收改进创新,逐步发展出来神威系列处理器和超级计算机。
       其实,早在2008年,神威已经搞出来神威1600处理器,这个16核心的神威1600在1.1ghz的时候,双精度浮点运算能力是140.8G,i7 980xe 6核心在3.2ghz,双精度浮点是107.55G。i7的功耗是130W,神威1600的功耗是70W。神威1600同样集成了四路双通道DDR3内存控制器和I/O,水平已经相当高了
       2011年的时候,神威曾经露了一小脸,有过一个叫神威蓝光的超级计算机,进入了世界前十,而且只用了9个机柜。
       如果当年神威蓝光要搞个大新闻,只要加到160个机柜就可以当2011年的世界第一了,根本不用等到今天

       当时神威就已经提出来下一代要搞众核,也就是今天太湖之光用的CPU。因为当年Alpha21364已经考虑了128个核心众核结构的通讯问题,所以神威新一代众核产品也很顺利。
       如今,太湖之光出来,无论是性能还是功耗,效率都是世界第一,其实这是从1999年开始持续研发10多年的水到渠成。

三、太湖之光的意义

       目前,太湖之光用的神威处理器工艺还是非常落后的,大约落后Intel两到三代。但是凭借架构的优势,太湖之光依然达到了顶级的运算能力。
       如果未来中芯国际给力,追近Intel,那么神威性能会更强。
      不过,我们要知道,神威这种项目是给军方研发的,用于高科技项目,编程是非常困难的,通用型也很差。其他领域就是有授权使用,编程也会很困难。所以这个世界第一的超级计算机不会有很高的利用率。
      但是,这台计算机告诉世界,中国已经自己的超级计算能力,各种禁运就没有必要搞了。高科技军事中国可以用自主的超级计算机算。
     至于游戏,动画,金融,天气……,IBM和Intel还是可以卖机器,卖处理器的。
     非军用领域,不仅仅要考虑性能,还要考虑生态和成本。工具方便,开发简单的东西效益更高。这些领域用神威就太贵太麻烦了,效率也未必高。
     2015年,美国还对中国搞禁运,不允许Intel出口高性能的协处理器。说中国人用于军事用途,用于核研究云云。
     而神威太湖之光告诉美国人,这种禁运是脱裤子放屁,根本就没有必要。买你们的高性能处理器,协处理器是商用,军用我们有更强的。
    “敌人有的,我们要有,敌人没有的,我们也要有。”这是毛主席说的,神威做到了
http://www.techweb.com.cn/column/2016-06-23/2350492.shtml

您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

QQ|申请友链|旗下论坛|小黑屋|手机版|航空航天港 ( 豫ICP备12024513号 )

GMT+8, 2017-7-25 00:33 , Processed in 0.294625 second(s), 18 queries , Gzip On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表